Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/popstas/yandex-speechkit-talk-recognition
Распознавание больших файлов разговоров через Yandex SpeechKit
https://github.com/popstas/yandex-speechkit-talk-recognition
speech-recognition speechkit yandex-speechkit-api
Last synced: 21 days ago
JSON representation
Распознавание больших файлов разговоров через Yandex SpeechKit
- Host: GitHub
- URL: https://github.com/popstas/yandex-speechkit-talk-recognition
- Owner: popstas
- Created: 2021-02-27T13:15:21.000Z (almost 4 years ago)
- Default Branch: master
- Last Pushed: 2023-12-12T08:54:37.000Z (about 1 year ago)
- Last Synced: 2023-12-12T09:43:28.340Z (about 1 year ago)
- Topics: speech-recognition, speechkit, yandex-speechkit-api
- Language: JavaScript
- Homepage:
- Size: 698 KB
- Stars: 4
- Watchers: 2
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- Changelog: CHANGELOG.md
Awesome Lists containing this project
README
Распознавание больших файлов через Yandex SpeechKit.
[Распознавание длинных аудио](https://cloud.yandex.ru/docs/speechkit/stt/transcribation) - документация
### Что делает
1. Конвертирует файл в OGG Opus
2. Заливает файл на Yandex Object Storage
3. Отправляет файл на распознавание
4. Дожидается результата (проверка раз в 10 секунд)Данные сохраняет в `~/yandex-stt/`.
### Установка
```
npm install -g yandex-speechkit-talk-recognition
```### Зависимости
- ffmpeg 4.x (3.4 не подойдёт)### Как запустить
1. Создать сервисный аккаунт, получить API ключ (в документации), вписать его в `config.js`.
2. Создать статический ключ, получить Id и Secret
3. Запустить `yandex-stt --file <путь_к_файлу_с_голосом>`, создастся конфиг в `~/yandex-stt/config.js`.
4. Заполнить конфиг
5. Запускать `yandex-stt --file ` или yandex-stt --id abcde`### Стоимость
Распознавание с низким приоритетом (deferred) стоит примерно 15 копеек/минута, грубо говоря, 10 руб/час. [Тарифы](https://cloud.yandex.ru/docs/speechkit/pricing#rules-stt-long).## TODO:
- Права на файлы. У каждой операции должен быть владелец. Он может обновлять файлы
- Изменение filename
- Изменение распознанного текста