An open API service indexing awesome lists of open source software.

https://github.com/ddlBoJack/Speech-Resources

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐
https://github.com/ddlBoJack/Speech-Resources

speech speech-processing

Last synced: 15 days ago
JSON representation

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐

Awesome Lists containing this project

README

        

**Table of Contents** *generated with [DocToc](https://github.com/thlorenz/doctoc)*

- [Speech-Resource](#speech-resource)
- [国内高校](#%E5%9B%BD%E5%86%85%E9%AB%98%E6%A0%A1)
- [清华大学](#%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6)
- [北京大学](#%E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6)
- [上海交通大学](#%E4%B8%8A%E6%B5%B7%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6)
- [中国科学院](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2)
- [中国科学技术大学](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E6%8A%80%E6%9C%AF%E5%A4%A7%E5%AD%A6)
- [西北工业大学](#%E8%A5%BF%E5%8C%97%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)
- [天津大学](#%E5%A4%A9%E6%B4%A5%E5%A4%A7%E5%AD%A6)
- [厦门大学](#%E5%8E%A6%E9%97%A8%E5%A4%A7%E5%AD%A6)
- [昆山杜克大学](#%E6%98%86%E5%B1%B1%E6%9D%9C%E5%85%8B%E5%A4%A7%E5%AD%A6)
- [浙江大学](#%E6%B5%99%E6%B1%9F%E5%A4%A7%E5%AD%A6)
- [哈尔滨工业大学](#%E5%93%88%E5%B0%94%E6%BB%A8%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)
- [香港中文大学](#%E9%A6%99%E6%B8%AF%E4%B8%AD%E6%96%87%E5%A4%A7%E5%AD%A6)
- [香港科技大学](#%E9%A6%99%E6%B8%AF%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6)
- [香港理工大学](#%E9%A6%99%E6%B8%AF%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [台湾大学](#%E5%8F%B0%E6%B9%BE%E5%A4%A7%E5%AD%A6)
- [海外高校](#%E6%B5%B7%E5%A4%96%E9%AB%98%E6%A0%A1)
- [剑桥大学](#%E5%89%91%E6%A1%A5%E5%A4%A7%E5%AD%A6)
- [牛津大学](#%E7%89%9B%E6%B4%A5%E5%A4%A7%E5%AD%A6)
- [爱丁堡大学](#%E7%88%B1%E4%B8%81%E5%A0%A1%E5%A4%A7%E5%AD%A6)
- [谢菲尔德大学](#%E8%B0%A2%E8%8F%B2%E5%B0%94%E5%BE%B7%E5%A4%A7%E5%AD%A6)
- [蒙特利尔大学](#%E8%92%99%E7%89%B9%E5%88%A9%E5%B0%94%E5%A4%A7%E5%AD%A6)
- [麻省理工大学](#%E9%BA%BB%E7%9C%81%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [卡耐基梅隆大学](#%E5%8D%A1%E8%80%90%E5%9F%BA%E6%A2%85%E9%9A%86%E5%A4%A7%E5%AD%A6)
- [约翰霍普金斯大学](#%E7%BA%A6%E7%BF%B0%E9%9C%8D%E6%99%AE%E9%87%91%E6%96%AF%E5%A4%A7%E5%AD%A6)
- [南加州大学](#%E5%8D%97%E5%8A%A0%E5%B7%9E%E5%A4%A7%E5%AD%A6)
- [德克萨斯州大学达拉斯分校](#%E5%BE%B7%E5%85%8B%E8%90%A8%E6%96%AF%E5%B7%9E%E5%A4%A7%E5%AD%A6%E8%BE%BE%E6%8B%89%E6%96%AF%E5%88%86%E6%A0%A1)
- [罗切斯特大学](#%E7%BD%97%E5%88%87%E6%96%AF%E7%89%B9%E5%A4%A7%E5%AD%A6)
- [布尔诺理工大学](#%E5%B8%83%E5%B0%94%E8%AF%BA%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [俄亥俄州立大学](#%E4%BF%84%E4%BA%A5%E4%BF%84%E5%B7%9E%E7%AB%8B%E5%A4%A7%E5%AD%A6)
- [新加坡国立大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E5%9B%BD%E7%AB%8B%E5%A4%A7%E5%AD%A6)
- [南洋理工大学](#%E5%8D%97%E6%B4%8B%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)
- [新加坡科技设计大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E7%A7%91%E6%8A%80%E8%AE%BE%E8%AE%A1%E5%A4%A7%E5%AD%A6)
- [国立情报学研究所(Tokyo)](#%E5%9B%BD%E7%AB%8B%E6%83%85%E6%8A%A5%E5%AD%A6%E7%A0%94%E7%A9%B6%E6%89%80tokyo)
- [国内企业](#%E5%9B%BD%E5%86%85%E4%BC%81%E4%B8%9A)
- [期刊&会议](#%E6%9C%9F%E5%88%8A%E4%BC%9A%E8%AE%AE)
- [竞赛](#%E7%AB%9E%E8%B5%9B)
- [公众号](#%E5%85%AC%E4%BC%97%E5%8F%B7)
- [知乎专栏](#%E7%9F%A5%E4%B9%8E%E4%B8%93%E6%A0%8F)
- [常用资源](#%E5%B8%B8%E7%94%A8%E8%B5%84%E6%BA%90)

# Speech-Resource

> 语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)

## 国内高校

### 清华大学

电子工程系

- 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
- [张超](http://mi.eng.cam.ac.uk/~cz277):加入清华前为谷歌语音组Senior Research Scientist

[电子工程系语音与音频技术实验室(SATLab)](http://web.ee.tsinghua.edu.cn/satlab)

- 刘加:原实验室主任
- [张卫强](http://web.ee.tsinghua.edu.cn/wqzhang):实验室主任,语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

- [欧志坚](http://oa.ee.tsinghua.edu.cn/~ouzhijian/index.htm)

[清华大学信息技术研究院语音和语言技术研究中心(CSLT)](http://cslt.riit.tsinghua.edu.cn/index.php)

该实验室以声纹识别为特色,对应北京得意音通公司。

- [郑方](http://cslt.riit.tsinghua.edu.cn/~fzheng/index.htm)
- [周强](http://cslt.riit.tsinghua.edu.cn/~qzhou/eng/index.htm)
- [王东](http://wangd.cslt.org/)

计算机系

- [贾珈](http://hcsi.cs.tsinghua.edu.cn/jiajia):人机语音交互,偏向多媒体方向

[清华大学人机语音交互实验室(THUHCSI)](https://thuhcsi.github.io/)

- [吴志勇](https://www.sigs.tsinghua.edu.cn/zywu/main.htm)

### 北京大学

[计算机科学技术研究所数字音频实验室](https://www.icst.pku.edu.cn/audioLab/index.htm)

该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。

- 陈晓鸥
- 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

- 邹月娴

### 上海交通大学

[计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)](https://x-lance.sjtu.edu.cn/)

对应思必驰公司。

- 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
- 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
- 吴梦玥:语音感知与生成、多模态语音
- 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

- 王钰

### 中国科学院

[自动化所模式识别国家重点实验室](http://www.ia.cas.cn/)

- 徐波
- 陶建华
- 刘文举
- 刘斌

声学所

- 颜永红

### 中国科学技术大学

[语音及语言信息处理国家工程实验室](http://nelslip.ustc.edu.cn/)

对应科大讯飞,国内领先水平。

- 刘庆峰

- 胡郁

- 戴礼荣
- 王仁华

- 陈恩红
- [凌震华](http://staff.ustc.edu.cn/~zhling/)
- 杜俊

### 西北工业大学

[音频语音与语言处理研究组(ASLP)](http://www.npu-aslp.org/)

- [谢磊](http://lxie.npu-aslp.org/)

[智能声学与临境通信研究中心(CIAIC)](https://www.ciaic.org/)

- 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好

### 天津大学

智能与计算学部

- 党建武
- 王龙标

### 厦门大学

智能科学与技术系

- 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别

### 昆山杜克大学

大数据研究中心(SMIIPLab)

- 李明

### 浙江大学

计算机科学与技术学院

- 赵洲

### 哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

- [韩纪庆](http://homepage.hit.edu.cn/hanjiqing)

### 香港中文大学

[Human-Computer Communications Laboratory (HCCL)](https://www1.se.cuhk.edu.hk/~hccl/publications/)

- [蒙美玲](https://www.se.cuhk.edu.hk/people/academic-staff/prof-meng-mei-ling-helen/)
- [刘循英](https://www1.se.cuhk.edu.hk/~xyliu/)
- [吴锡欣](https://www1.se.cuhk.edu.hk/~wuxx/)

香港中文大学电子工程系

- [李丹](https://www.ee.cuhk.edu.hk/~tanlee/)
- [孔秋强](https://qiuqiangkong.github.io/)

香港中文大学(深圳)数据科学学院

- [李海洲](https://colips.org/~eleliha/)
- 武执正

### 香港科技大学

计算机科学与工程系

- [Brain Mak](https://www.cse.ust.hk/faculty/mak/)
- [雪巍](https://facultyprofiles.hkust.edu.hk/profiles.php?profile=wei-xue-weixue)

### 香港理工大学

电子信息工程系

- [Man-Wai Mak](http://www.eie.polyu.edu.hk/~mwmak/)

### 台湾大学

Speech Processing and Machine Learning Laboratory

- [李琳山](https://speech.ee.ntu.edu.tw/previous_version/lslNew.htm)
- [李宏毅](https://speech.ee.ntu.edu.tw/~hylee/index.php)

## 海外高校

### 剑桥大学

Machine Intelligence Laboratory - Speech Research Group

- Steve Young: The HTK book 一作

- Phil Woodland
- Mark Gales

### 牛津大学

Visual Geometry Group

- Andrew Zisserman

### 爱丁堡大学

The Centre for Speech Technology Research

- [Simon King](https://homepages.inf.ed.ac.uk/simonk/)
- Steve Renals
- Peter Bell
- Hao Tang

### 谢菲尔德大学

Speech and Hearing Group

- [Thomas Hain](https://staffwww.dcs.shef.ac.uk/people/T.Hain/)
- [Jon Barker](http://staffwww.dcs.shef.ac.uk/people/J.Barker/)
- [Heidi Christensen](https://heidi-christensen.github.io/website//)
- [Roger K. Moore](http://staffwww.dcs.shef.ac.uk/people/R.K.Moore/)

### 蒙特利尔大学

Mila - Quebec AI Institute

- [Yoshua Bengio](https://yoshuabengio.org/)

### 麻省理工大学

MIT CSAIL

- James Glass
- [Antonio Torralba](http://web.mit.edu/torralba/www/)

### 卡耐基梅隆大学

- [Shinji Watanabe](https://sites.google.com/view/shinjiwatanabe)

### 约翰霍普金斯大学

Center for Language and Speech Processing

- Sanjeev Khudanpur

### 南加州大学

- [Shrikanth (Shri) Narayanan](https://scholar.google.com/citations?hl=zh-CN&user=8EDHmYkAAAAJ&view_op=list_works&sortby=pubdate)

### 德克萨斯州大学达拉斯分校

- [John Hansen](https://scholar.google.com/citations?user=hfADwdIAAAAJ&hl=zh-CN)

### 罗切斯特大学

- [Zhiyao Duan](https://scholar.google.com/citations?hl=en&user=pJmAoJ4AAAAJ&view_op=list_works&sortby=pubdate)

### 布尔诺理工大学

Faculty of Information Technology

- Lukas Burget
- Jan Cernocky

### 俄亥俄州立大学

- [DeLiang Wang](https://scholar.google.com/citations?user=yO59sggAAAAJ&hl=zh-CN)

### 新加坡国立大学

Human Language Technology Laboratory

- [Haizhou Li](https://colips.org/~eleliha/)

### 南洋理工大学

- [Eng-Siong Chng](https://personal.ntu.edu.sg/aseschng/intro1.html)

### 新加坡科技设计大学

- [Berrak Sisman](https://istd.sutd.edu.sg/people/faculty/berrak-sisman)

### 国立情报学研究所(Tokyo)

- [Junichi Yamagishi](https://scholar.google.com/citations?user=nRrdjtwAAAAJ&hl=zh-CN)

## 国内企业

- MSRA-NLC组
- MSRA-ML组
- 腾讯AILAB语音技术中心
- 腾讯天籁实验室
- 阿里达摩院智能语音实验室
- 阿里天猫精灵
- 字节跳动SAMI组
- 科大讯飞
- 搜狗
- 百度小度
- 小米小爱
- 小米k2
- 思必驰
- 云知声
- 出门问问WeNet
- 标贝科技

## 期刊&会议

- TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
- TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
- TSLP(ACM Transactions on Speech and Language Processing)
- ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
- INTERSPEECH(Conference of the International Speech Communication Association)
- ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
- SLT(IEEE Spoken Language Technology Workshop)
- SPL(IEEE Signal Processing Letters)
- ISCSLP(International Symposium on Chinese Spoken Language Processing)
- JSLHR(Journal of Speech, Language, and Hearing Research)
- Computer Speech and Language
- Speaker Odyssey
- JASA(Journal of the Acoustical Society of America)
- Signal Processing
- Speech Communication

## 竞赛

- CHiME
- VCC
- DCASE
- NIST SRE
- Blizzard Challenge
- OLR东方语种识别
- VoxSRC

## 公众号

- 语音杂谈
- 谈谈语音技术
- WeNet步行街
- CCF语音对话与听觉专委会

- 语音之家
- 智能语音青年
- 低调奋进
- 新一代Kaldi

## 知乎专栏

[谈谈语音技术](https://www.zhihu.com/column/c_1409104824050446336)

[自监督语音识别](https://www.zhihu.com/column/c_1446609615102832640)

[Kaldi源码解析](https://www.zhihu.com/column/c_1313042386550267904)

[espnet--一个端到端语音识别工具箱](https://www.zhihu.com/column/espnet)

[新一代Kaldi](https://www.zhihu.com/people/yaozengwei/posts)

## 常用资源

[语音识别数据集汇总](https://github.com/double22a/speech_dataset)

[语音识别 benchmark](https://github.com/SpeechColab/Leaderboard)

[语音预训练 paper list](https://github.com/ddlBoJack/Awesome-Speech-Pretraining)

[语音合成 paper list](https://github.com/wenet-e2e/speech-synthesis-paper)

[语音增强 paper list](https://github.com/Wenzhe-Liu/awesome-speech-enhancement)