https://github.com/ddlBoJack/Speech-Resources
语音方向实验室/公司/资源/实习等,欢迎推荐或自荐
https://github.com/ddlBoJack/Speech-Resources
speech speech-processing
Last synced: 15 days ago
JSON representation
语音方向实验室/公司/资源/实习等,欢迎推荐或自荐
- Host: GitHub
- URL: https://github.com/ddlBoJack/Speech-Resources
- Owner: ddlBoJack
- Created: 2021-11-04T03:38:45.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2024-11-13T20:26:11.000Z (5 months ago)
- Last Synced: 2025-03-15T18:15:02.273Z (about 1 month ago)
- Topics: speech, speech-processing
- Homepage:
- Size: 5.44 MB
- Stars: 547
- Watchers: 20
- Forks: 68
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-speech-enhancement - [Link
README
**Table of Contents** *generated with [DocToc](https://github.com/thlorenz/doctoc)*
- [Speech-Resource](#speech-resource)
- [国内高校](#%E5%9B%BD%E5%86%85%E9%AB%98%E6%A0%A1)
- [清华大学](#%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6)
- [北京大学](#%E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6)
- [上海交通大学](#%E4%B8%8A%E6%B5%B7%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6)
- [中国科学院](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2)
- [中国科学技术大学](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E6%8A%80%E6%9C%AF%E5%A4%A7%E5%AD%A6)
- [西北工业大学](#%E8%A5%BF%E5%8C%97%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)
- [天津大学](#%E5%A4%A9%E6%B4%A5%E5%A4%A7%E5%AD%A6)
- [厦门大学](#%E5%8E%A6%E9%97%A8%E5%A4%A7%E5%AD%A6)
- [昆山杜克大学](#%E6%98%86%E5%B1%B1%E6%9D%9C%E5%85%8B%E5%A4%A7%E5%AD%A6)
- [浙江大学](#%E6%B5%99%E6%B1%9F%E5%A4%A7%E5%AD%A6)
- [哈尔滨工业大学](#%E5%93%88%E5%B0%94%E6%BB%A8%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)
- [香港中文大学](#%E9%A6%99%E6%B8%AF%E4%B8%AD%E6%96%87%E5%A4%A7%E5%AD%A6)
- [香港科技大学](#%E9%A6%99%E6%B8%AF%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6)
- [香港理工大学](#%E9%A6%99%E6%B8%AF%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [台湾大学](#%E5%8F%B0%E6%B9%BE%E5%A4%A7%E5%AD%A6)
- [海外高校](#%E6%B5%B7%E5%A4%96%E9%AB%98%E6%A0%A1)
- [剑桥大学](#%E5%89%91%E6%A1%A5%E5%A4%A7%E5%AD%A6)
- [牛津大学](#%E7%89%9B%E6%B4%A5%E5%A4%A7%E5%AD%A6)
- [爱丁堡大学](#%E7%88%B1%E4%B8%81%E5%A0%A1%E5%A4%A7%E5%AD%A6)
- [谢菲尔德大学](#%E8%B0%A2%E8%8F%B2%E5%B0%94%E5%BE%B7%E5%A4%A7%E5%AD%A6)
- [蒙特利尔大学](#%E8%92%99%E7%89%B9%E5%88%A9%E5%B0%94%E5%A4%A7%E5%AD%A6)
- [麻省理工大学](#%E9%BA%BB%E7%9C%81%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [卡耐基梅隆大学](#%E5%8D%A1%E8%80%90%E5%9F%BA%E6%A2%85%E9%9A%86%E5%A4%A7%E5%AD%A6)
- [约翰霍普金斯大学](#%E7%BA%A6%E7%BF%B0%E9%9C%8D%E6%99%AE%E9%87%91%E6%96%AF%E5%A4%A7%E5%AD%A6)
- [南加州大学](#%E5%8D%97%E5%8A%A0%E5%B7%9E%E5%A4%A7%E5%AD%A6)
- [德克萨斯州大学达拉斯分校](#%E5%BE%B7%E5%85%8B%E8%90%A8%E6%96%AF%E5%B7%9E%E5%A4%A7%E5%AD%A6%E8%BE%BE%E6%8B%89%E6%96%AF%E5%88%86%E6%A0%A1)
- [罗切斯特大学](#%E7%BD%97%E5%88%87%E6%96%AF%E7%89%B9%E5%A4%A7%E5%AD%A6)
- [布尔诺理工大学](#%E5%B8%83%E5%B0%94%E8%AF%BA%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [俄亥俄州立大学](#%E4%BF%84%E4%BA%A5%E4%BF%84%E5%B7%9E%E7%AB%8B%E5%A4%A7%E5%AD%A6)
- [新加坡国立大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E5%9B%BD%E7%AB%8B%E5%A4%A7%E5%AD%A6)
- [南洋理工大学](#%E5%8D%97%E6%B4%8B%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [新加坡科技设计大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E7%A7%91%E6%8A%80%E8%AE%BE%E8%AE%A1%E5%A4%A7%E5%AD%A6)
- [国立情报学研究所(Tokyo)](#%E5%9B%BD%E7%AB%8B%E6%83%85%E6%8A%A5%E5%AD%A6%E7%A0%94%E7%A9%B6%E6%89%80tokyo)
- [国内企业](#%E5%9B%BD%E5%86%85%E4%BC%81%E4%B8%9A)
- [期刊&会议](#%E6%9C%9F%E5%88%8A%E4%BC%9A%E8%AE%AE)
- [竞赛](#%E7%AB%9E%E8%B5%9B)
- [公众号](#%E5%85%AC%E4%BC%97%E5%8F%B7)
- [知乎专栏](#%E7%9F%A5%E4%B9%8E%E4%B8%93%E6%A0%8F)
- [常用资源](#%E5%B8%B8%E7%94%A8%E8%B5%84%E6%BA%90)# Speech-Resource
> 语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)
## 国内高校
### 清华大学
电子工程系
- 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
- [张超](http://mi.eng.cam.ac.uk/~cz277):加入清华前为谷歌语音组Senior Research Scientist[电子工程系语音与音频技术实验室(SATLab)](http://web.ee.tsinghua.edu.cn/satlab)
- 刘加:原实验室主任
- [张卫强](http://web.ee.tsinghua.edu.cn/wqzhang):实验室主任,语音识别、音频识别、音乐与声学信号处理电子工程系语音处理与机器智能实验室(SPMI lab)
- [欧志坚](http://oa.ee.tsinghua.edu.cn/~ouzhijian/index.htm)
[清华大学信息技术研究院语音和语言技术研究中心(CSLT)](http://cslt.riit.tsinghua.edu.cn/index.php)
该实验室以声纹识别为特色,对应北京得意音通公司。
- [郑方](http://cslt.riit.tsinghua.edu.cn/~fzheng/index.htm)
- [周强](http://cslt.riit.tsinghua.edu.cn/~qzhou/eng/index.htm)
- [王东](http://wangd.cslt.org/)计算机系
- [贾珈](http://hcsi.cs.tsinghua.edu.cn/jiajia):人机语音交互,偏向多媒体方向
[清华大学人机语音交互实验室(THUHCSI)](https://thuhcsi.github.io/)
- [吴志勇](https://www.sigs.tsinghua.edu.cn/zywu/main.htm)
### 北京大学
[计算机科学技术研究所数字音频实验室](https://www.icst.pku.edu.cn/audioLab/index.htm)
该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。
- 陈晓鸥
- 杨德顺深圳研究生院现代信号与数据处理实验室(ADSPLAB)
- 邹月娴
### 上海交通大学
[计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)](https://x-lance.sjtu.edu.cn/)
对应思必驰公司。
- 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
- 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
- 吴梦玥:语音感知与生成、多模态语音
- 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher电子系未来媒体协同创新中心
- 王钰
### 中国科学院
[自动化所模式识别国家重点实验室](http://www.ia.cas.cn/)
- 徐波
- 陶建华
- 刘文举
- 刘斌声学所
- 颜永红
### 中国科学技术大学
[语音及语言信息处理国家工程实验室](http://nelslip.ustc.edu.cn/)
对应科大讯飞,国内领先水平。
- 刘庆峰
- 胡郁
- 戴礼荣
- 王仁华- 陈恩红
- [凌震华](http://staff.ustc.edu.cn/~zhling/)
- 杜俊### 西北工业大学
[音频语音与语言处理研究组(ASLP)](http://www.npu-aslp.org/)
- [谢磊](http://lxie.npu-aslp.org/)
[智能声学与临境通信研究中心(CIAIC)](https://www.ciaic.org/)
- 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好
### 天津大学
智能与计算学部
- 党建武
- 王龙标### 厦门大学
智能科学与技术系
- 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别
### 昆山杜克大学
大数据研究中心(SMIIPLab)
- 李明
### 浙江大学
计算机科学与技术学院
- 赵洲
### 哈尔滨工业大学
计算机科学与技术学院听觉智能研究中心
- [韩纪庆](http://homepage.hit.edu.cn/hanjiqing)
### 香港中文大学
[Human-Computer Communications Laboratory (HCCL)](https://www1.se.cuhk.edu.hk/~hccl/publications/)
- [蒙美玲](https://www.se.cuhk.edu.hk/people/academic-staff/prof-meng-mei-ling-helen/)
- [刘循英](https://www1.se.cuhk.edu.hk/~xyliu/)
- [吴锡欣](https://www1.se.cuhk.edu.hk/~wuxx/)香港中文大学电子工程系
- [李丹](https://www.ee.cuhk.edu.hk/~tanlee/)
- [孔秋强](https://qiuqiangkong.github.io/)香港中文大学(深圳)数据科学学院
- [李海洲](https://colips.org/~eleliha/)
- 武执正### 香港科技大学
计算机科学与工程系
- [Brain Mak](https://www.cse.ust.hk/faculty/mak/)
- [雪巍](https://facultyprofiles.hkust.edu.hk/profiles.php?profile=wei-xue-weixue)### 香港理工大学
电子信息工程系
- [Man-Wai Mak](http://www.eie.polyu.edu.hk/~mwmak/)
### 台湾大学
Speech Processing and Machine Learning Laboratory
- [李琳山](https://speech.ee.ntu.edu.tw/previous_version/lslNew.htm)
- [李宏毅](https://speech.ee.ntu.edu.tw/~hylee/index.php)## 海外高校
### 剑桥大学
Machine Intelligence Laboratory - Speech Research Group
- Steve Young: The HTK book 一作
- Phil Woodland
- Mark Gales### 牛津大学
Visual Geometry Group
- Andrew Zisserman
### 爱丁堡大学
The Centre for Speech Technology Research
- [Simon King](https://homepages.inf.ed.ac.uk/simonk/)
- Steve Renals
- Peter Bell
- Hao Tang### 谢菲尔德大学
Speech and Hearing Group
- [Thomas Hain](https://staffwww.dcs.shef.ac.uk/people/T.Hain/)
- [Jon Barker](http://staffwww.dcs.shef.ac.uk/people/J.Barker/)
- [Heidi Christensen](https://heidi-christensen.github.io/website//)
- [Roger K. Moore](http://staffwww.dcs.shef.ac.uk/people/R.K.Moore/)### 蒙特利尔大学
Mila - Quebec AI Institute
- [Yoshua Bengio](https://yoshuabengio.org/)
### 麻省理工大学
MIT CSAIL
- James Glass
- [Antonio Torralba](http://web.mit.edu/torralba/www/)### 卡耐基梅隆大学
- [Shinji Watanabe](https://sites.google.com/view/shinjiwatanabe)
### 约翰霍普金斯大学
Center for Language and Speech Processing
- Sanjeev Khudanpur
### 南加州大学
- [Shrikanth (Shri) Narayanan](https://scholar.google.com/citations?hl=zh-CN&user=8EDHmYkAAAAJ&view_op=list_works&sortby=pubdate)
### 德克萨斯州大学达拉斯分校
- [John Hansen](https://scholar.google.com/citations?user=hfADwdIAAAAJ&hl=zh-CN)
### 罗切斯特大学
- [Zhiyao Duan](https://scholar.google.com/citations?hl=en&user=pJmAoJ4AAAAJ&view_op=list_works&sortby=pubdate)
### 布尔诺理工大学
Faculty of Information Technology
- Lukas Burget
- Jan Cernocky### 俄亥俄州立大学
- [DeLiang Wang](https://scholar.google.com/citations?user=yO59sggAAAAJ&hl=zh-CN)
### 新加坡国立大学
Human Language Technology Laboratory
- [Haizhou Li](https://colips.org/~eleliha/)
### 南洋理工大学
- [Eng-Siong Chng](https://personal.ntu.edu.sg/aseschng/intro1.html)
### 新加坡科技设计大学
- [Berrak Sisman](https://istd.sutd.edu.sg/people/faculty/berrak-sisman)
### 国立情报学研究所(Tokyo)
- [Junichi Yamagishi](https://scholar.google.com/citations?user=nRrdjtwAAAAJ&hl=zh-CN)
## 国内企业
- MSRA-NLC组
- MSRA-ML组
- 腾讯AILAB语音技术中心
- 腾讯天籁实验室
- 阿里达摩院智能语音实验室
- 阿里天猫精灵
- 字节跳动SAMI组
- 科大讯飞
- 搜狗
- 百度小度
- 小米小爱
- 小米k2
- 思必驰
- 云知声
- 出门问问WeNet
- 标贝科技## 期刊&会议
- TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
- TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
- TSLP(ACM Transactions on Speech and Language Processing)
- ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
- INTERSPEECH(Conference of the International Speech Communication Association)
- ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
- SLT(IEEE Spoken Language Technology Workshop)
- SPL(IEEE Signal Processing Letters)
- ISCSLP(International Symposium on Chinese Spoken Language Processing)
- JSLHR(Journal of Speech, Language, and Hearing Research)
- Computer Speech and Language
- Speaker Odyssey
- JASA(Journal of the Acoustical Society of America)
- Signal Processing
- Speech Communication## 竞赛
- CHiME
- VCC
- DCASE
- NIST SRE
- Blizzard Challenge
- OLR东方语种识别
- VoxSRC## 公众号
- 语音杂谈
- 谈谈语音技术
- WeNet步行街
- CCF语音对话与听觉专委会- 语音之家
- 智能语音青年
- 低调奋进
- 新一代Kaldi## 知乎专栏
[谈谈语音技术](https://www.zhihu.com/column/c_1409104824050446336)
[自监督语音识别](https://www.zhihu.com/column/c_1446609615102832640)
[Kaldi源码解析](https://www.zhihu.com/column/c_1313042386550267904)
[espnet--一个端到端语音识别工具箱](https://www.zhihu.com/column/espnet)
[新一代Kaldi](https://www.zhihu.com/people/yaozengwei/posts)
## 常用资源
[语音识别数据集汇总](https://github.com/double22a/speech_dataset)
[语音识别 benchmark](https://github.com/SpeechColab/Leaderboard)
[语音预训练 paper list](https://github.com/ddlBoJack/Awesome-Speech-Pretraining)
[语音合成 paper list](https://github.com/wenet-e2e/speech-synthesis-paper)
[语音增强 paper list](https://github.com/Wenzhe-Liu/awesome-speech-enhancement)