https://github.com/ddlBoJack/Speech-Resources

语音方向实验室/公司/资源/实习等，欢迎推荐或自荐
https://github.com/ddlBoJack/Speech-Resources
speech speech-processing
Last synced: over 1 year ago
JSON representation
语音方向实验室/公司/资源/实习等，欢迎推荐或自荐
Host: GitHub
URL: https://github.com/ddlBoJack/Speech-Resources
Owner: ddlBoJack
Created: 2021-11-04T03:38:45.000Z (over 4 years ago)
Default Branch: main
Last Pushed: 2024-11-13T20:26:11.000Z (over 1 year ago)
Last Synced: 2025-03-15T18:15:02.273Z (over 1 year ago)
Topics: speech, speech-processing
Homepage:
Size: 5.44 MB
Stars: 547
Watchers: 20
Forks: 68
Open Issues: 2
Metadata Files:
- Readme: README.md
Awesome Lists containing this project

awesome-speech-enhancement - [Link
README

          

**Table of Contents**  *generated with [DocToc](https://github.com/thlorenz/doctoc)*

- [Speech-Resource](#speech-resource)

  - [国内高校](#%E5%9B%BD%E5%86%85%E9%AB%98%E6%A0%A1)

    - [清华大学](#%E6%B8%85%E5%8D%8E%E5%A4%A7%E5%AD%A6)

    - [北京大学](#%E5%8C%97%E4%BA%AC%E5%A4%A7%E5%AD%A6)

    - [上海交通大学](#%E4%B8%8A%E6%B5%B7%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6)

    - [中国科学院](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E9%99%A2)

    - [中国科学技术大学](#%E4%B8%AD%E5%9B%BD%E7%A7%91%E5%AD%A6%E6%8A%80%E6%9C%AF%E5%A4%A7%E5%AD%A6)

    - [西北工业大学](#%E8%A5%BF%E5%8C%97%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)

    - [天津大学](#%E5%A4%A9%E6%B4%A5%E5%A4%A7%E5%AD%A6)

    - [厦门大学](#%E5%8E%A6%E9%97%A8%E5%A4%A7%E5%AD%A6)

    - [昆山杜克大学](#%E6%98%86%E5%B1%B1%E6%9D%9C%E5%85%8B%E5%A4%A7%E5%AD%A6)

    - [浙江大学](#%E6%B5%99%E6%B1%9F%E5%A4%A7%E5%AD%A6)

    - [哈尔滨工业大学](#%E5%93%88%E5%B0%94%E6%BB%A8%E5%B7%A5%E4%B8%9A%E5%A4%A7%E5%AD%A6)

    - [香港中文大学](#%E9%A6%99%E6%B8%AF%E4%B8%AD%E6%96%87%E5%A4%A7%E5%AD%A6)

    - [香港科技大学](#%E9%A6%99%E6%B8%AF%E7%A7%91%E6%8A%80%E5%A4%A7%E5%AD%A6)

    - [香港理工大学](#%E9%A6%99%E6%B8%AF%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)

    - [台湾大学](#%E5%8F%B0%E6%B9%BE%E5%A4%A7%E5%AD%A6)

  - [海外高校](#%E6%B5%B7%E5%A4%96%E9%AB%98%E6%A0%A1)

    - [剑桥大学](#%E5%89%91%E6%A1%A5%E5%A4%A7%E5%AD%A6)

    - [牛津大学](#%E7%89%9B%E6%B4%A5%E5%A4%A7%E5%AD%A6)

    - [爱丁堡大学](#%E7%88%B1%E4%B8%81%E5%A0%A1%E5%A4%A7%E5%AD%A6)

    - [谢菲尔德大学](#%E8%B0%A2%E8%8F%B2%E5%B0%94%E5%BE%B7%E5%A4%A7%E5%AD%A6)

    - [蒙特利尔大学](#%E8%92%99%E7%89%B9%E5%88%A9%E5%B0%94%E5%A4%A7%E5%AD%A6)

    - [麻省理工大学](#%E9%BA%BB%E7%9C%81%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)

    - [卡耐基梅隆大学](#%E5%8D%A1%E8%80%90%E5%9F%BA%E6%A2%85%E9%9A%86%E5%A4%A7%E5%AD%A6)

    - [约翰霍普金斯大学](#%E7%BA%A6%E7%BF%B0%E9%9C%8D%E6%99%AE%E9%87%91%E6%96%AF%E5%A4%A7%E5%AD%A6)

    - [南加州大学](#%E5%8D%97%E5%8A%A0%E5%B7%9E%E5%A4%A7%E5%AD%A6)

    - [德克萨斯州大学达拉斯分校](#%E5%BE%B7%E5%85%8B%E8%90%A8%E6%96%AF%E5%B7%9E%E5%A4%A7%E5%AD%A6%E8%BE%BE%E6%8B%89%E6%96%AF%E5%88%86%E6%A0%A1)

    - [罗切斯特大学](#%E7%BD%97%E5%88%87%E6%96%AF%E7%89%B9%E5%A4%A7%E5%AD%A6)

    - [布尔诺理工大学](#%E5%B8%83%E5%B0%94%E8%AF%BA%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)

    - [俄亥俄州立大学](#%E4%BF%84%E4%BA%A5%E4%BF%84%E5%B7%9E%E7%AB%8B%E5%A4%A7%E5%AD%A6)

    - [新加坡国立大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E5%9B%BD%E7%AB%8B%E5%A4%A7%E5%AD%A6)

    - [南洋理工大学](#%E5%8D%97%E6%B4%8B%E7%90%86%E5%B7%A5%E5%A4%A7%E5%AD%A6)

    - [新加坡科技设计大学](#%E6%96%B0%E5%8A%A0%E5%9D%A1%E7%A7%91%E6%8A%80%E8%AE%BE%E8%AE%A1%E5%A4%A7%E5%AD%A6)

    - [国立情报学研究所（Tokyo）](#%E5%9B%BD%E7%AB%8B%E6%83%85%E6%8A%A5%E5%AD%A6%E7%A0%94%E7%A9%B6%E6%89%80tokyo)

  - [国内企业](#%E5%9B%BD%E5%86%85%E4%BC%81%E4%B8%9A)

  - [期刊&会议](#%E6%9C%9F%E5%88%8A%E4%BC%9A%E8%AE%AE)

  - [竞赛](#%E7%AB%9E%E8%B5%9B)

  - [公众号](#%E5%85%AC%E4%BC%97%E5%8F%B7)

  - [知乎专栏](#%E7%9F%A5%E4%B9%8E%E4%B8%93%E6%A0%8F)

  - [常用资源](#%E5%B8%B8%E7%94%A8%E8%B5%84%E6%BA%90)

# Speech-Resource

> 语音方向实验室/公司/资源/实习等，欢迎推荐或自荐（排名不分先后）



## 国内高校

### 清华大学

电子工程系

- 吴及：电子工程系副系主任，研究方向侧重于语音语言智能与医学结合

- [张超](http://mi.eng.cam.ac.uk/~cz277)：加入清华前为谷歌语音组Senior Research Scientist

[电子工程系语音与音频技术实验室(SATLab)](http://web.ee.tsinghua.edu.cn/satlab)

- 刘加：原实验室主任

- [张卫强](http://web.ee.tsinghua.edu.cn/wqzhang)：实验室主任，语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

- [欧志坚](http://oa.ee.tsinghua.edu.cn/~ouzhijian/index.htm)

[清华大学信息技术研究院语音和语言技术研究中心(CSLT)](http://cslt.riit.tsinghua.edu.cn/index.php)

该实验室以声纹识别为特色，对应北京得意音通公司。

- [郑方](http://cslt.riit.tsinghua.edu.cn/~fzheng/index.htm)

- [周强](http://cslt.riit.tsinghua.edu.cn/~qzhou/eng/index.htm)

- [王东](http://wangd.cslt.org/)

计算机系

- [贾珈](http://hcsi.cs.tsinghua.edu.cn/jiajia)：人机语音交互，偏向多媒体方向

[清华大学人机语音交互实验室(THUHCSI)](https://thuhcsi.github.io/)

- [吴志勇](https://www.sigs.tsinghua.edu.cn/zywu/main.htm)

### 北京大学

[计算机科学技术研究所数字音频实验室](https://www.icst.pku.edu.cn/audioLab/index.htm)

该实验室以多媒体音视频内容的检索与挖掘为主，很多内容涉及音频方向。

- 陈晓鸥

- 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

- 邹月娴

### 上海交通大学

[计算机系跨媒体语言智能实验室(现X-Lance，前SpeechLab)](https://x-lance.sjtu.edu.cn/)

对应思必驰公司。

- 俞凯：实验室主任，思必驰首席科学家，语音识别与合成，语音软硬件协同

- 钱彦旻：实验室副主任，鲁棒性、多语言、低资源语音识别，Kaldi唯一的亚洲作者

- 吴梦玥：语音感知与生成、多模态语音

- 陈谐：端到端语音识别，加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

- 王钰

### 中国科学院

[自动化所模式识别国家重点实验室](http://www.ia.cas.cn/)

- 徐波

- 陶建华

- 刘文举

- 刘斌

声学所

- 颜永红

### 中国科学技术大学

[语音及语言信息处理国家工程实验室](http://nelslip.ustc.edu.cn/)

对应科大讯飞，国内领先水平。

- 刘庆峰

- 胡郁

- 戴礼荣

- 王仁华

- 陈恩红

- [凌震华](http://staff.ustc.edu.cn/~zhling/)

- 杜俊

### 西北工业大学

[音频语音与语言处理研究组(ASLP)](http://www.npu-aslp.org/)

- [谢磊](http://lxie.npu-aslp.org/)

[智能声学与临境通信研究中心(CIAIC)](https://www.ciaic.org/)

- 陈景东：前贝尔实验室资深研究员，信号和信息处理做的很好

### 天津大学

智能与计算学部

- 党建武

- 王龙标

### 厦门大学

智能科学与技术系

- 洪青阳：天聪智能创始人，主要研究语音识别、声纹识别

### 昆山杜克大学

大数据研究中心(SMIIPLab)

- 李明

### 浙江大学

计算机科学与技术学院

- 赵洲

### 哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

- [韩纪庆](http://homepage.hit.edu.cn/hanjiqing)

### 香港中文大学

[Human-Computer Communications Laboratory (HCCL)](https://www1.se.cuhk.edu.hk/~hccl/publications/)

- [蒙美玲](https://www.se.cuhk.edu.hk/people/academic-staff/prof-meng-mei-ling-helen/)

- [刘循英](https://www1.se.cuhk.edu.hk/~xyliu/)

- [吴锡欣](https://www1.se.cuhk.edu.hk/~wuxx/)

香港中文大学电子工程系

- [李丹](https://www.ee.cuhk.edu.hk/~tanlee/)

- [孔秋强](https://qiuqiangkong.github.io/)

香港中文大学（深圳）数据科学学院

- [李海洲](https://colips.org/~eleliha/)

- 武执正

### 香港科技大学

计算机科学与工程系

- [Brain Mak](https://www.cse.ust.hk/faculty/mak/)

- [雪巍](https://facultyprofiles.hkust.edu.hk/profiles.php?profile=wei-xue-weixue)

### 香港理工大学

电子信息工程系

- [Man-Wai Mak](http://www.eie.polyu.edu.hk/~mwmak/)

### 台湾大学

Speech Processing and Machine Learning Laboratory

- [李琳山](https://speech.ee.ntu.edu.tw/previous_version/lslNew.htm)

- [李宏毅](https://speech.ee.ntu.edu.tw/~hylee/index.php)

## 海外高校

### 剑桥大学

Machine Intelligence Laboratory - Speech Research Group

- Steve Young: The HTK book 一作

- Phil Woodland

- Mark Gales

### 牛津大学

Visual Geometry Group

- Andrew Zisserman

### 爱丁堡大学

The Centre for Speech Technology Research

- [Simon King](https://homepages.inf.ed.ac.uk/simonk/)

- Steve Renals

- Peter Bell

- Hao Tang

### 谢菲尔德大学

Speech and Hearing Group

- [Thomas Hain](https://staffwww.dcs.shef.ac.uk/people/T.Hain/)

- [Jon Barker](http://staffwww.dcs.shef.ac.uk/people/J.Barker/)

- [Heidi Christensen](https://heidi-christensen.github.io/website//)

- [Roger K. Moore](http://staffwww.dcs.shef.ac.uk/people/R.K.Moore/)

### 蒙特利尔大学

Mila - Quebec AI Institute

- [Yoshua Bengio](https://yoshuabengio.org/)

### 麻省理工大学

MIT CSAIL

- James Glass

- [Antonio Torralba](http://web.mit.edu/torralba/www/)

### 卡耐基梅隆大学

- [Shinji Watanabe](https://sites.google.com/view/shinjiwatanabe)

### 约翰霍普金斯大学

Center for Language and Speech Processing

- Sanjeev Khudanpur

### 南加州大学

- [Shrikanth (Shri) Narayanan](https://scholar.google.com/citations?hl=zh-CN&user=8EDHmYkAAAAJ&view_op=list_works&sortby=pubdate)

### 德克萨斯州大学达拉斯分校

- [John Hansen](https://scholar.google.com/citations?user=hfADwdIAAAAJ&hl=zh-CN)

### 罗切斯特大学

- [Zhiyao Duan](https://scholar.google.com/citations?hl=en&user=pJmAoJ4AAAAJ&view_op=list_works&sortby=pubdate)

### 布尔诺理工大学

Faculty of Information Technology

- Lukas Burget

- Jan Cernocky

### 俄亥俄州立大学

- [DeLiang Wang](https://scholar.google.com/citations?user=yO59sggAAAAJ&hl=zh-CN)

### 新加坡国立大学

Human Language Technology Laboratory

- [Haizhou Li](https://colips.org/~eleliha/)

### 南洋理工大学

- [Eng-Siong Chng](https://personal.ntu.edu.sg/aseschng/intro1.html)

### 新加坡科技设计大学

- [Berrak Sisman](https://istd.sutd.edu.sg/people/faculty/berrak-sisman)

### 国立情报学研究所（Tokyo）

- [Junichi Yamagishi](https://scholar.google.com/citations?user=nRrdjtwAAAAJ&hl=zh-CN)

## 国内企业

- MSRA-NLC组

- MSRA-ML组

- 腾讯AILAB语音技术中心

- 腾讯天籁实验室

- 阿里达摩院智能语音实验室

- 阿里天猫精灵

- 字节跳动SAMI组

- 科大讯飞

- 搜狗

- 百度小度

- 小米小爱

- 小米k2

- 思必驰

- 云知声

- 出门问问WeNet

- 标贝科技

## 期刊&会议

- TPAMI（IEEE Trans on Pattern Analysis and Machine Intelligence）

- TASLP（IEEE Transactions on Audio, Speech, and Language Processing）

- TSLP（ACM Transactions on Speech and Language Processing）

- ICASSP（IEEE International Conference on Acoustics, Speech and Signal Processing）

- INTERSPEECH（Conference of the International Speech Communication Association）

- ASRU（IEEE Automatic Speech Recognition and Understanding Workshop）

- SLT（IEEE Spoken Language Technology Workshop）

- SPL（IEEE Signal Processing Letters）

- ISCSLP（International Symposium on Chinese Spoken Language Processing）

- JSLHR（Journal of Speech, Language, and Hearing Research）

- Computer Speech and Language

- Speaker Odyssey

- JASA（Journal of the Acoustical Society of America）

- Signal Processing

- Speech Communication

## 竞赛

- CHiME

- VCC

- DCASE

- NIST SRE

- Blizzard Challenge

- OLR东方语种识别

- VoxSRC

## 公众号

- 语音杂谈

- 谈谈语音技术

- WeNet步行街

- CCF语音对话与听觉专委会

- 语音之家

- 智能语音青年

- 低调奋进

- 新一代Kaldi

## 知乎专栏

[谈谈语音技术](https://www.zhihu.com/column/c_1409104824050446336)

[自监督语音识别](https://www.zhihu.com/column/c_1446609615102832640)

[Kaldi源码解析](https://www.zhihu.com/column/c_1313042386550267904)

[espnet--一个端到端语音识别工具箱](https://www.zhihu.com/column/espnet)

[新一代Kaldi](https://www.zhihu.com/people/yaozengwei/posts)

## 常用资源

[语音识别数据集汇总](https://github.com/double22a/speech_dataset)

[语音识别 benchmark](https://github.com/SpeechColab/Leaderboard)

[语音预训练 paper list](https://github.com/ddlBoJack/Awesome-Speech-Pretraining)

[语音合成 paper list](https://github.com/wenet-e2e/speech-synthesis-paper)

[语音增强 paper list](https://github.com/Wenzhe-Liu/awesome-speech-enhancement)
ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/ddlBoJack/Speech-Resources

Awesome Lists containing this project

README