https://github.com/notai-tech/indicasr
Speeech Recognition for Indic languages.
https://github.com/notai-tech/indicasr
asr indian-language pytorch speech-recognition speech-to-text telugu transformers wav2vec wav2vec2
Last synced: about 1 month ago
JSON representation
Speeech Recognition for Indic languages.
- Host: GitHub
- URL: https://github.com/notai-tech/indicasr
- Owner: notAI-tech
- License: gpl-3.0
- Created: 2021-03-19T06:42:53.000Z (over 4 years ago)
- Default Branch: main
- Last Pushed: 2021-04-03T10:24:11.000Z (over 4 years ago)
- Last Synced: 2025-08-19T16:33:57.721Z (about 2 months ago)
- Topics: asr, indian-language, pytorch, speech-recognition, speech-to-text, telugu, transformers, wav2vec, wav2vec2
- Language: Python
- Homepage:
- Size: 623 KB
- Stars: 14
- Watchers: 4
- Forks: 3
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# IndicASR
Speech Recognition for Indian Languages# Notes
- IndicASR is built on top of  and  and has pre-trained models for `Telugu` in the current release.
- The Telugu model is trained on the train set of MSR Indic corpus + a private corpus of ~94 hours obtained from various telugu interview playlists from Youtube.
# Use as python module
```bash
pip install --upgrade indicasr
``````python
from indicasr import IndicASR
asr = IndicASR("telugu")
# Run one file at once
asr.transcribe("samples/telugu/hari.16k.wav")
# "ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు"# Batch inference
asr.transcribe(["samples/telugu/hari.16k.wav",
"samples/telugu/ramana.16k.wav"])
# ["ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు",
# "భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు"]
```|sample name | prediction | expected |
|--------|:--------------:|:--------------:
|telugu/hari.16k.wav | ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు | ఈ సినిమా తర్వాత నిర్మాతలు రూటు మార్చే ఆలోచనలో ఉన్నారు |
|telugu/harsha.16k.wav| నేను ఇప్పుడు గడ్డి కొడుతున్నారు | నేను ఇప్పుడు గడ్డి కొడుతున్నాను |
|telugu/indra.16k.wav| నేను భారత దేశంలో ఉన్నాను | నేను భారత దేశంలో ఉన్నాను |
|telugu/praneeth.16k.wav| నా పేరు ప్రణి బేదపూడి | నా పేరు ప్రణీత్ బేదపూడి |
|telugu/ramana.16k.wav| భారత దేశము నా మాత్ర భూమి భారతీవులంతా నా సోదరి సోదరులు | భారత దేశము నా మాతృ భూమి భారతీయులంతా నా సోదరీ సోదరులు|
|telugu/sai_krishna.16k.wav| నా పేరు సాయి కృష్ణ | నా పేరు సాయి కృష్ణ |