https://github.com/nodef/extra-googletts

Generate speech audio from super long text through machine (via "Google TTS", "ffmpeg").
https://github.com/nodef/extra-googletts

audio cli console extra ffmpeg google googletts long machine shell speech text tts

Last synced: 11 months ago
JSON representation

Generate speech audio from super long text through machine (via "Google TTS", "ffmpeg").

Host: GitHub
URL: https://github.com/nodef/extra-googletts
Owner: nodef
License: mit
Created: 2018-11-09T13:40:24.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2025-04-08T17:11:51.000Z (over 1 year ago)
Last Synced: 2025-06-15T21:19:56.871Z (about 1 year ago)
Topics: audio, cli, console, extra, ffmpeg, google, googletts, long, machine, shell, speech, text, tts
Language: JavaScript
Homepage: https://www.npmjs.com/package/extra-googletts
Size: 311 KB
Stars: 5
Watchers: 2
Forks: 2
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          Generate speech audio from super long text through machine, via [Google TTS], [ffmpeg].

> Do you want to:

> - Share your ideas anonymously on YouTube?

> - Pretend on phone that you are not a kid (Home Alone)?

> - Learn good english pronunciation for a speech?

> - Make your computer read out your school notes?

> - Experiment with various voices from around the globe?

> - Or, [Upload Wikipedia TTS videos on YouTube]?

Sample: ["I want to order a stuffed crust pizza"](https://clyp.it/kje2yfdk).







## Setup

### Install

1. Run `npm install -g extra-googletts` in **console**.

2. To install this as a package use `npm install extra-googletts`.

3. Make sure [ffmpeg] is installed (present in PATH).

### Get service account key

1. Create an [account] on [Google Cloud Platform].

2. Create a [new project], and select it.

3. Enable [Cloud Text-to-Speech API] for the project.

4. Add [credentials] to your project.

5. Which API are you using? `Cloud Text-to-Speech API`.

6. Are you planning to use this API with App Engine or Compute Engine? `No, I’m not using them`.

7. Select `What credentials do I need`?.

8. Create a service account.

9. Service account name: `googletts` (your choice).

10. Role: `Project -> Owner`.

11. Service account ID: `googletts` (same as name).

12. Key type: `JSON`.

13. Select `Continue`.

14. Copy downloaded file to a directory.

15. Rename the file to `account_id.json`.

### Set environment variable

1. Copy path of `account_id.json`.

2. Set environment variable `GOOGLE_APPLICATION_CREDENTIALS` to it.

> On Windows, use [RapidEE] to set environment variable.

```bash

# on linux or macos console

export GOOGLE_APPLICATION_CREDENTIALS="[PATH OF account_id.json]"

# on windows powershell

$env:GOOGLE_APPLICATION_CREDENTIALS="[PATH OF account_id.json]"

```







## Console

```bash

googletts "I want to order a stuffed crust pizza"

# out.mp3 created (yay!)

googletts -t speech.txt -o speech.mp3

# speech.mp3 created from text in speech.txt

googletts "Hello 911, my husband is in danger!" -vg female

# out.mp3 created with female voice

echo "Dead man walking." | googletts --log -vn en-US-Wavenet-B

# out.mp3 created with different male voice (log enabled)

```

> Available [TTS voices]?

### Reference

```bash

googletts [options] 

# text: input text

# Options:

# --help:        show this help

# -l, --log:     enable log

# -o, --output:  set output audio file (out.mp3)

# -t, --text:    set input text file

# -r, --retries: set speech synthesis retries (8)

# -a, --acodec:  set acodec (copy)

# -ae, --audio_encoding:  set audio encoding (MP3)

# -af, --audio_frequency: set audio frequency/sample rate

# -lc, --language_code:   set language code (en-US)

# -vn, --voice_name:      set voice name

# -vg, --voice_gender:    set voice gender (neutral)

# -vp, --voice_pitch:     set voice pitch change (0.0)

# -vr, --voice_rate:      set voice speaking rate (1.0)

# -vv, --voice_volume:    set voice volume gain in dB (0.0)

# -qb, --quote_break:        set quoted text break time (250)

# -qe, --quote_emphasis:     set quoted text emphasis level (moderate)

# -hb, --heading_break:      set heading text break time (4000)

# -hd, --heading_difference: set heading text break difference (250)

# -he, --heading_emphasis:   set heading text emphasis level (strong)

# -eb, --ellipsis_break:     set ellipsis break time (1500)

# -db, --dash_break:         set dash break time (500)

# -nb, --newline_break:      set newline break time (1000)

# -bs, --block_separator:    set block separator (.)

# -bl, --block_length:       set block length (5000)

# -ccf, --config_credentials_file: set google credentials path

# Environment variables:

$TTS_LOG     # enable log (0)

$TTS_OUTPUT  # set output audio file (out.mp3)

$TTS_TEXT    # set input text file

$TTS_RETRIES # set speech synthesis retries (8)

$TTS_ACODEC  # set acodec (copy)

$TTS_AUDIO_ENCODING     # set audio encoding (MP3)

$TTS_AUDIO_FREQUENCY    # set audio frequency/sample rate

$TTS_LANGUAGE_CODE      # set language code (en-US)

$TTS_VOICE_NAME         # set voice name

$TTS_VOICE_GENDER       # set voice gender (neutral)

$TTS_VOICE_PITCH        # set voice pitch change (0.0)

$TTS_VOICE_RATE         # set voice speaking rate (1.0)

$TTS_VOICE_VOLUME       # set voice volume gain in dB (0.0)

$TTS_QUOTE_BREAK        # set quoted text break time (250)

$TTS_QUOTE_EMPHASIS     # set quoted text emphasis level (moderate)

$TTS_HEADING_BREAK      # set heading text break time (4000)

$TTS_HEADING_DIFFERENCE # set heading text break difference (250)

$TTS_HEADING_EMPHASIS   # set heading text emphasis level (strong)

$TTS_ELLIPSIS_BREAK     # set ellipsis break time (1500)

$TTS_DASH_BREAK         # set dash break time (500)

$TTS_NEWLINE_BREAK      # set newline break time (1000)

$TTS_BLOCK_SEPARATOR    # set block separator (.)

$TTS_BLOCK_LENGTH       # set block length (5000)

$GOOGLE_APPLICATION_CREDENTIALS # set google credentials path

```







## Package

```javascript

const googletts = require('extra-googletts');

await googletts('out.mp3', 'I want to order a stuffed crust pizza');

// out.mp3 created (yay!)

const fs = require('fs');

var speech = fs.readFileSync('speech.txt', 'utf8');

await googletts('speech.mp3', speech)

// speech.mp3 created from text in speech.txt

await googletts('out.mp3', 'Hello 911, my husband is in danger!', {

  voice: {gender: 'FEMALE'}

});

// out.mp3 created with female voice

await googletts('out.mp3', 'Dead man walking.', {

  voice: {name: 'en-US-Wavenet-B'}, log: true

});

// out.mp3 created with different male voice (log enabled)

```

### Reference

```javascript

const googletts = require('extra-googletts');

googletts(output, text, options={})

// output:  output audio file

// text:    input text

// options: given below

// -> Promise 

// Default options:

options = {

  stdio: [0, 1, 2], // set child process stdio

  log: false,       // enable log

  retries: 8,       // set speech synthesis retries

  acodec: 'copy',   // set audio acodec

  audio: {

    encoding: 'MP3',     // set audio encoding

    frequency: 0,        // set audio frequency/sample rate

  },

  language: {

    code: 'en-US'        // set language code

  },

  voice: {

    name: null,          // set voice name

    gender: 'NEUTRAL'    // set voice SSML gender

    pitch: 0.0,          // set voice pitch change

    rate: 1.0,           // set voice speaking rate

    volume: 0.0,         // set voice volume gain in dB

  }

  quote: {

    break: 250,          // set quoted text break time

    emphasis: 'moderate' // set quoted text emphasis level

  },

  heading: {

    break: 4000,         // set heading text break time

    difference: 250,     // set heading text break difference

    emphasis: 'strong',  // set heading text emphasis level

  },

  ellipsis: {

    break: 1500          // set ellipsis break time

  },

  dash: {

    break: 500           // set dash break time

  },

  newline: {

    break: 1000          // set newline break time

  },

  block: {

    separator: '.'       // set block separator

    length: 5000,        // set block length

  },

  config: {

    credentialsFile: null // set path to credentials

  },

  params: null            // set synthesize speech parameters "directly"

}

```







## Similar

Do you need anything similar?

- [extra-youtubeuploader] can upload videos with caption to YouTube.

- [extra-stillvideo] can generate video from audio and image.

Suggestions are welcome. Please [create an issue].







[![nodef](https://i.imgur.com/LPVfMny.jpg)](https://nodef.github.io)

> References: [SSML], [TTS voices], [TTS client docs].

[Google TTS]: https://cloud.google.com/text-to-speech/

[ffmpeg]: https://ffmpeg.org

[Upload Wikipedia TTS videos on YouTube]: https://www.youtube.com/results?search_query=wikipedia+audio+article

[Enable API]: https://console.cloud.google.com/flows/enableapi?apiid=texttospeech.googleapis.com

[Setup authentication]: https://cloud.google.com/docs/authentication/getting-started

[account]: https://accounts.google.com/signup

[Google Cloud Platform]: https://console.developers.google.com/

[new project]: https://console.cloud.google.com/projectcreate

[Cloud Text-to-Speech API]: https://console.cloud.google.com/apis/library/texttospeech.googleapis.com

[credentials]: https://console.cloud.google.com/apis/credentials/wizard

[RapidEE]: https://www.rapidee.com/en/about

[extra-stillvideo]: https://www.npmjs.com/package/extra-stillvideo

[extra-youtubeuploader]: https://www.npmjs.com/package/extra-youtubeuploader

[create an issue]: https://github.com/nodef/extra-googletts/issues

![](https://ga-beacon.deno.dev/G-RC63DPBH3P:SH3Eq-NoQ9mwgYeHWxu7cw/github.com/nodef/extra-googletts)

[SSML]: https://developers.google.com/actions/reference/ssml

[TTS voices]: https://cloud.google.com/text-to-speech/docs/voices

[TTS client docs]: https://cloud.google.com/nodejs/docs/reference/text-to-speech/0.1.x/v1beta1.TextToSpeechClient

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/nodef/extra-googletts

Awesome Lists containing this project

README