https://github.com/lihanghang/casr-demo

基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。
https://github.com/lihanghang/casr-demo

baidu-aip casr-demo ctc flask-application gmm pyaudio speaker-recognition speech-to-text

Last synced: about 2 months ago
JSON representation

基于Flask Web的中文自动语音识别演示系统,包含语音识别、语音合成、声纹识别之说话人识别。

Host: GitHub
URL: https://github.com/lihanghang/casr-demo
Owner: lihanghang
Created: 2019-05-06T07:46:40.000Z (over 6 years ago)
Default Branch: refactor/casr_demo
Last Pushed: 2024-03-31T13:07:52.000Z (over 1 year ago)
Last Synced: 2024-12-07T11:51:44.240Z (10 months ago)
Topics: baidu-aip, casr-demo, ctc, flask-application, gmm, pyaudio, speaker-recognition, speech-to-text
Language: CSS
Homepage:
Size: 97.2 MB
Stars: 156
Watchers: 4
Forks: 28
Open Issues: 5
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# CASR-DEMO(中文自动语音识别演示系统）

## ChangeLog

### 2024-03-31

0. 可用功能为：说话人识别，语音识别。合成功能不可用。
1. 重构了代码结构，最新分支为refactor/casr_demo，大家可以使用。
2. 在Mac上做过验证。Python不低于3.8.
3. 测试发现，有些关于语音的包安装可能不会直接成功，但是只要Google下就能解决。

## 启动方式

```shell
conda create -n casr python==3.12
pip install -r requirements.txt
python src/manage.py
```

## 关于本项目的一些说明

> 首先，欢迎大家关注项目，进行学习研究。收到一些小伙伴的问题我就集中回答下，这里是demo的源码、有两个版本其一是名为speech_env,这是一个简单的语音识别功能，界面如下面的效果图一；还有一个是V2.0的目录，这个版本功能比较齐全，界面如效果图二。大家感兴趣在自己机器上试试的话我推荐直接使用v2.0版本，还有一点项目只在win10平台上测试过，其他不保证能不能运行。由于月久失更，有些依赖包可能需要修改，不过应该都是小问题，根据实际过程的报错信息修复就行。再次感谢大家的关注！

---

## 最新整理了两个版本的发布版

- [点此处详见](https://github.com/lihanghang/CASR-DEMO/releases)

## speech_env（效果图一）

![效果图1](./image/CASR_DEMO_up.png)

## speechV2.0 基于第三方接口实现语音识别和语音合成、说话人识别功能(效果图二)

![效果图2](./image/asr_tts.png)

---

E-mail:
wiki:
Updated on December 25,2019.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/lihanghang/casr-demo

Awesome Lists containing this project

README