Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/innnky/vispeech

基于vits fastspeech2 visinger的tts模型
https://github.com/innnky/vispeech

Last synced: 2 months ago
JSON representation

基于vits fastspeech2 visinger的tts模型

Awesome Lists containing this project

README

        

# visinger-speech

基于fs2、vits、visinger的tts模型
(暂时还在开发调试中)
(效果暂时依旧不太满意)

[//]: # (音频sample见[samples](/samples))
## 模型结构
总的来说基本就是将fastspeech2的VarianceAdapter结构添加进了vits

## 相比于原版vits
+ 删除了 Monotonoic Alignment, 使用MFA对齐后输入时长
+ 添加了音素级 F0Predictor,EnergyPredictor
+ 可以逐音素手动编辑音高、音量和时长
+ 添加了FramePriorNetwork
+ 使用飞桨paddlespeech作为中文文本前端,实现更可靠的文本正则化以及G2P
+ 采样率使用44100hz
## 参考
+ [vits](https://github.com/jaywalnut310/vits)
+ [FastSpeech2](https://github.com/ming024/FastSpeech2)
+ [Period VITS](https://arxiv.org/pdf/2210.15964.pdf)
+ [VISinger](https://github.com/So-Fann/VISinger)