{"id":28360414,"url":"https://github.com/espnet/notebook","last_synced_at":"2025-08-13T21:36:32.403Z","repository":{"id":36124145,"uuid":"199614656","full_name":"espnet/notebook","owner":"espnet","description":null,"archived":false,"fork":false,"pushed_at":"2025-06-09T18:43:25.000Z","size":18300,"stargazers_count":67,"open_issues_count":7,"forks_count":40,"subscribers_count":6,"default_branch":"master","last_synced_at":"2025-06-23T00:39:19.283Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":null,"language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/espnet.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null}},"created_at":"2019-07-30T08:58:49.000Z","updated_at":"2025-06-09T18:43:30.000Z","dependencies_parsed_at":"2023-12-13T13:30:44.473Z","dependency_job_id":"77995aa0-f10c-4976-887b-7a72f79d95c2","html_url":"https://github.com/espnet/notebook","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/espnet/notebook","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/espnet%2Fnotebook","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/espnet%2Fnotebook/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/espnet%2Fnotebook/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/espnet%2Fnotebook/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/espnet","download_url":"https://codeload.github.com/espnet/notebook/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/espnet%2Fnotebook/sbom","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":270321706,"owners_count":24564630,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","status":"online","status_checked_at":"2025-08-13T02:00:09.904Z","response_time":66,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2025-05-28T11:07:55.666Z","updated_at":"2025-08-13T21:36:32.398Z","avatar_url":"https://github.com/espnet.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# ESPnet Notebooks\n\n## Demo\n\n### ASR (Speech recognition)\n\n- [`asr_realtime_demo.ipynb`](ESPnet2/Demo/ASR/asr_realtime_demo.ipynb): ASR realtime inference with various pre-trained models.\n- [`asr_transfer_learning_demo.ipynb`](ESPnet2/Demo/ASR/asr_transfer_learning_demo.ipynb): Demo on how to use pre-trained ASR models for fine-tuning.\n- [`streaming_asr_demo.ipynb`](ESPnet2/Demo/ASR/streaming_asr_demo.ipynb): Streaming ASR realtime inference with pre-trained models.\n\n### SE (Speech enhancement/separation)\n\n- [`se_demo.ipynb`](ESPnet2/Demo/SE/se_demo.ipynb): Speech enhancement/separation inference with various pre-trained models.\n- [`se_demo_for_waspaa_2021.ipynb`](ESPnet2/Demo/SE/se_demo_for_waspaa_2021.ipynb): WASPAA2021 version of ESPnet-SE demo.\n\n### SLU (Spoken language understanding)\n\n- [`2pass_slu_demo.ipynb`](ESPnet2/Demo/SLU/2pass_slu_demo.ipynb): Two pass spoken language understanding pre-trained model examples.\n\n### TTS (Text-to-speech)\n\n- [`tts_realtime_demo.ipynb`](ESPnet2/Demo/TTS/tts_realtime_demo.ipynb): TTS realtime inference with various pre-trained models.\n\n### Other utilities\n\n- [`onnx_conversion_demo.ipynb`](ESPnet2/Demo/Others/onnx_conversion_demo.ipynb): How to convert ESPnet models into ONNX format.\n\n\n## ESPnet-EZ\n\n### ASR (Speech recognition)\n- [`train_from_scratch.ipynb`](ESPnetEZ/ASR/train_from_scratch.ipynb): Training an ASR model with ESPnet-EZ on LibriSpeech-100.\n- [`ASR_finetune_owsm.ipynb`](ESPnetEZ/ASR/ASR_finetune_owsm.ipynb): Fine-tuning the weakly-supervised model (OWSM) with ESPnet-EZ on custom dataset.\n\n### ST (Speech-to-text translation)\n- [`integrate_huggingface.ipynb`](ESPnetEZ/ST/integrate_huggingface.ipynb): Integrating the weakly-supervised model (OWSM) and huggingface's pre-trained language model with ESPnet-EZ on MuST-C-v2.\n- [`ST_finetune_owsm.ipynb`](ESPnetEZ/ST/ST_finetune_owsm.ipynb): Fine-tuning the weakly-supervised model (OWSM) with ESPnet-EZ on MuST-C-v2.\n\n### SLU (Spoken language understanding)\n- [`SLU_finetune_owsm.ipynb`](ESPnetEZ/SLU/SLU_finetune_owsm.ipynb): Fine-tuning the weakly-supervised model (OWSM) with ESPnet-EZ on SLURP.\n\n### TTS (Text-to-speech)\n- [`TTS_finetune_vctk_dump.ipynb`](ESPnetEZ/TTS/TTS_finetune_vctk_dump.ipynb): Fine-tuning a pre-trained VITS model with ESPnet-EZ on the VCTK dataset.\n\n### SVS (Singing voice synthesis)\n- [`SVS_finetune_ace-kising.ipynb`](ESPnetEZ/SVS/SVS_finetune_ace-kising.ipynb): Fine-tuning a pre-trained VISinger 2 model with ESPnet-EZ on ACE-KiSing.\n\n\n## Course\n\n### CMU SpeechProcessing Spring2023\n\n- [`assignment0_data-prep.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment0_data-prep.ipynb): Course assignment on how to prepare ESPnet-format data.\n- [`assignment1_espnet-tutorial.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment1_espnet-tutorial.ipynb): A simplified version of previous year's new task tutorial.\n- [`assignemnt3_spk.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment3_spk.ipynb): Examples of using ESPnet to extract speaker embeddings and conduct speaker recognition.\n- [`assignment4_ssl.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment4_ssl.ipynb): Exploration on using self-supervised speech representation to ESPnet ASR training.\n- [`assignment5_st.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment5_st.ipynb): Examples of state-of-the-art speech translation models in ESPnet.\n- [`assignment6_slu.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment6_slu.ipynb): Examples of state-of-the-art spoken language understanding models in ESPnet.\n- [`assignment7_se.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment7_se.ipynb): Examples of state-of-the-art speech enhancement/separation in ESPnet.\n- [`assignment8_tts.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/assignment8_tts.ipynb): A student version of espnet2-tts realtime demonstration.\n- [`s2st_demo.ipynb`](ESPnet2/Course/CMU_SpeechProcessing_Spring2023/s2st_demo.ipynb): An example of existing speech-to-speech translation model for ESPnet.\n\n### CMU SpeechRecognition Fall2022\n\n- [`recipe_tutorial.ipynb`](ESPnet2/Course/CMU_SpeechRecognition_Fall2022/recipe_tutorial.ipynb): A general tutorial of stage-by-stage explanation of ESPnet2 recipes (with new functions).\n- [`new_task_tutorial.ipynb`](ESPnet2/Course/CMU_SpeechRecognition_Fall2022/new_task_tutorial.ipynb): A tutorial on how to add new models/tasks to ESPnet framework.\n\n### CMU SpeechRecognition Fall2021\n\n- [`general_tutorial.ipynb`](ESPnet2/Course/CMU_SpeechRecognition_Fall2021/general_tutorial.ipynb): A general tutorial of stage-by-stage explanation of ESPnet2 recipes.\n\n## ESPnet1 (Legacy)\n\n- [`asr_library.ipynb`](ESPnet1/asr_library.ipynb): Speech recognition library explanation with network training.\n- [`asr_recipe.ipynb`](ESPnet1/asr_recipe.ipynb): Speech recognition recipe explanation.\n- [`pretrained.ipynb`](ESPnet1/pretrained.ipynb): Tutorial on how to use pre-trained models.\n- [`st_demo.ipynb`](ESPnet1/st_demo.ipynb): Speech translation demonstration with a TTS model to achieve speech-to-speech translation.\n- [`tts_realtime_demo.ipynb`](ESPnet1/tts_realtime_demo.ipynb): TTS demonstration with different pre-trained TTS models.\n- [`tts_recipe.ipynb`](ESPnet1/tts_recipe.ipynb): Stage explanation for TTS recipes.\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fespnet%2Fnotebook","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fespnet%2Fnotebook","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fespnet%2Fnotebook/lists"}