{"id":23102693,"url":"https://github.com/dataxujing/asr-paper","last_synced_at":"2025-10-08T22:22:37.769Z","repository":{"id":112304908,"uuid":"566118467","full_name":"DataXujing/ASR-paper","owner":"DataXujing","description":":fire: ASR教程: https://dataxujing.github.io/ASR-paper/","archived":false,"fork":false,"pushed_at":"2024-07-01T05:37:22.000Z","size":1148069,"stargazers_count":25,"open_issues_count":0,"forks_count":6,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-08-16T15:41:12.731Z","etag":null,"topics":["asr","citrinet","conformer","contextnet","ctc","dnn-hmm","fbank","gmm-hmm","jasper","las","mfcc","mocha","neural-transducer","quartznet","rnn-t","speech-transformer","squeezeformer","tandem","transformer-transducer","wfst"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"other","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/DataXujing.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE.txt","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null}},"created_at":"2022-11-15T02:03:45.000Z","updated_at":"2025-08-07T12:27:53.000Z","dependencies_parsed_at":"2023-05-15T04:00:54.253Z","dependency_job_id":"e56a33a5-a6cb-48b2-a474-c74c0d9cfe1a","html_url":"https://github.com/DataXujing/ASR-paper","commit_stats":{"total_commits":121,"total_committers":1,"mean_commits":121.0,"dds":0.0,"last_synced_commit":"c3da3e88274613e517b559643700ade50488cd89"},"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/DataXujing/ASR-paper","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/DataXujing%2FASR-paper","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/DataXujing%2FASR-paper/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/DataXujing%2FASR-paper/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/DataXujing%2FASR-paper/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/DataXujing","download_url":"https://codeload.github.com/DataXujing/ASR-paper/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/DataXujing%2FASR-paper/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":279000782,"owners_count":26082851,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2025-10-08T02:00:06.501Z","response_time":56,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["asr","citrinet","conformer","contextnet","ctc","dnn-hmm","fbank","gmm-hmm","jasper","las","mfcc","mocha","neural-transducer","quartznet","rnn-t","speech-transformer","squeezeformer","tandem","transformer-transducer","wfst"],"created_at":"2024-12-17T00:00:20.933Z","updated_at":"2025-10-08T22:22:37.754Z","avatar_url":"https://github.com/DataXujing.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"\u003cimg src=\"docs/_media/icon.svg\" align=\"right\" alt=\"logo\" height=\"180\" width=\"180\" /\u003e\n\n# Welcome to ASR learning\n\n## GitHub最全ASR教程\n\n**徐静**\n\n2017年开始关注语音识别(ASR)，中间放弃了一段时间，这两年由于Transformer的流行，其端到端的ASR和基于工业应用的开源框架\n层出不穷，让我们开始学习吧！\n\n\u003c!-- \u003cdiv align=center\u003e\n\u003cimg src=\"./zh-cn/img/index/cnn_hist.png\" /\u003e\n\u003c/div\u003e --\u003e\n\n\n### 目录\n\n- [x] 1.李宏毅ASR课程笔记\n- [x] 2.GMM-HMM\n- [x] 3.Tandem\n- [x] 4.DNN-HMM Hybrid\n- [x] 5.LAS\n- [x] 6.CTC\n- [x] 7.RNA\n- [x] 8.RNN-Transducer(RNN-T)\n- [x] 9.Neural Transducer\n- [x] 10.MoChA]\n- [x] 11.Conformer\n- [x] 12.Transfomer-Transducer\n- [x] 13.DeepSpeech V1,V2,V3\n- [x] 14.FSMN\n- [x] 15.TDNN\n- [x] 16.Quartznet\n- [x] 17.Jasper\n- [x] 18.Citrinet\n- [x] 19.ContextNet \u003c!-- - [ ] 20.Conformer-CTC --\u003e\n- [x] 20.WeNet_paper\n- [x] 21.WFST\n- [x] 22.Hybrid CTC/Attention\n- [x] 29.Speech-Transformer\n- [x] 30.squeezeformer\n- [x] 23.开源语音识别数据集介绍\n- [x] 24.Kaldi学习\n- ~~25.K2学习~~\n- [x] 26.WeNet学习\n- [x] 27.ESPNet学习\n- [x] 28.NeMo学习\n- Triton inference server部署ASR服务(暂时不开源,可提供有偿服务)\n- TensorRT ASR模型部署(暂时不开源，可提供有偿服务)\n\n- [x] 31.Paraformer and  FunASR\n- [x] 32.Whisper\n\n\n\n\n\n\n\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fdataxujing%2Fasr-paper","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fdataxujing%2Fasr-paper","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fdataxujing%2Fasr-paper/lists"}