Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/mimisukemaster/gemini-voicevox-for-aituber

書籍「AITuberを作ってみたら生成AIプログラミングがよくわかった件」にて、APIをOpenAIからGeminiに変更したプログラム
https://github.com/mimisukemaster/gemini-voicevox-for-aituber

aituber gemini gemini-api generator openai-api openapi python voicevox

Last synced: about 2 months ago
JSON representation

書籍「AITuberを作ってみたら生成AIプログラミングがよくわかった件」にて、APIをOpenAIからGeminiに変更したプログラム

Host: GitHub
URL: https://github.com/mimisukemaster/gemini-voicevox-for-aituber
Owner: mimisukeMaster
License: mit
Created: 2024-09-08T02:49:00.000Z (4 months ago)
Default Branch: main
Last Pushed: 2024-09-08T08:10:02.000Z (4 months ago)
Last Synced: 2024-10-21T05:16:24.834Z (3 months ago)
Topics: aituber, gemini, gemini-api, generator, openai-api, openapi, python, voicevox
Language: Python
Homepage:
Size: 8.79 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# Gemini-VOICEVOX-for-AITuber
書籍「AITuberを作ってみたら生成AIプログラミングがよくわかった件」の中で紹介されている、LLMのAPIを使った実装部分を元に、OpenAI APIの代わりにGeminiAPIを使用するよう変更したものです。

OpenAPI には無料で使えるプランがないため、十分な無料枠を提供しているGemini APIに変更しました。

## Requirements
以下のパッケージを`pip`でインストールしてください。
```cmd
google-generativeai==0.7.2
python-dotenv==1.0.1
sounddevice==0.5.0
soundfile==0.12.1
numpy==2.1.0
requests==2.32.3
```
## Directory
```
Gemini-VOICEVOX-for-AITuber
| .env (作成してください)
| gemini_api.py
| gemini_voicevox.py
| make_list_sound_device.py
| voicevox_adapter.py
∟ play_sound.py
```
### gemini_api.py
Gemini APIを呼んで回答を出力するのみのスクリプトです。（API Keyの確認用）

### gemini_voicevox.py
メインのスクリプトです。Gemini API による回答を、VOICEVOXで読み上げます。

### make_list_sound_device.py
使用できるスピーカーを表示するスクリプトです。(後述)

### voicevox_adapter.py
VOICEVOXのAPIを呼ぶスクリプトです。

### play_sound.py
音を鳴らす処理を行うスクリプトです。

## Initial Setup
1. Gemini API Key を取得し、そのAPIKeyを`.env`ファイルに格納してください。
```env
API_KEY="**************"
```

2. 使用できるPC付属のスピーカーを設定する必要があります。[make_list_sound_device.py](/make_list_sound_device.py)を実行して、PCに搭載されているスピーカー名を取得してください。

その後、[gemini_voicevox](/gemini_voicevox.py)の以下の`Speaker`を変更してください。
```py
play_sound = PlaySound("Speaker")
```
例えば、以下のような場合
```log
0 Microsoft サウンドマッパー - Input, MME (2 in, 0 out)
> 1 Microphone Array (AMD Audio Dev, MME (2 in, 0 out)
2 Microsoft サウンドマッパー - Output, MME (0 in, 2 out)
3 スピーカー (Realtek(R) Audio), MME (0 in, 2 out)
:
```
`3`を使うならば、`スピーカー (Realtek(R) Audio)`に変更します。

## Execution
**必ずVOICEVOXソフトを起動してから**、[gemini_voicevox](/gemini_voicevox.py)を実行してください。

## Customize
[gemini_voicevox](/gemini_voicevox.py)の`prompt`で入力文を、
[voicevox_adapter.py](/voicevox_adapter.py)の`speaker_id`にて喋らせる声を変更できます。

## Reference
VOICEVOX ソフトのインストール
- https://voicevox.hiroshiba.jp/

ソフト起動中に閲覧できるドキュメントページ
- http://localhost:50021/docs

著者による書籍紹介記事
- https://note.com/saldra/n/nc5e09f822f1b

## Book information
「AITuberを作ってみたら生成AIプログラミングがよくわかった件」

著者：阿部由延 ([@sald_ra](https://x.com/sald_ra)) 氏

出版社：日経BP ([公式販売サイト](https://bookplus.nikkei.com/atcl/catalog/23/10/31/01079/))

## LICENCE
Gemini-VOICEVOX-for-AITuber is under [MIT license](/LICENSE).