https://github.com/eniompw/disneygpt

Training nanoGPT on Disney stories
https://github.com/eniompw/disneygpt

chatgpt gpt gpt-2 llm nanogpt

Last synced: about 2 months ago
JSON representation

Training nanoGPT on Disney stories

Host: GitHub
URL: https://github.com/eniompw/disneygpt
Owner: eniompw
License: mit
Created: 2023-06-13T10:26:01.000Z (about 3 years ago)
Default Branch: main
Last Pushed: 2023-07-20T10:38:05.000Z (almost 3 years ago)
Last Synced: 2025-03-27T04:43:46.456Z (about 1 year ago)
Topics: chatgpt, gpt, gpt-2, llm, nanogpt
Language: Jupyter Notebook
Homepage:
Size: 8.68 MB
Stars: 2
Watchers: 3
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

          # DisneyGPT

* [11M babyGPT on Chars](https://github.com/eniompw/DisneyGPT/blob/main/DisneyGPTChar.ipynb)

* [124M babyGPT using GPT2 Tokens](https://github.com/eniompw/DisneyGPT/blob/main/DisneyBabyGPT2.ipynb)

* [Based on eniompw/nanoGPTshakespeare](https://github.com/eniompw/nanoGPTshakespeare)

* [Based on karpathy/nanoGPT](https://github.com/karpathy/nanoGPT)

### Train GPT

From Chars Tokens

* `# Get GrimmsFairyTales Dataset`  

`!cp ./nanoGPT/data/shakespeare_char/ ./nanoGPT/data/disney/ -r`   

`!sed -i "15s,.*,    data_url = 'https://raw.githubusercontent.com/eniompw/DisneyGPT/main/GrimmsFairyTales.txt'," ./nanoGPT/data/disney/prepare.py`

* `# Train nanoGPT on Dataset`  

`!cd ./nanoGPT && python train.py config/train_shakespeare_char.py --dataset=DisneyChars --batch_size=12 --init_from='resume' --always_save_checkpoint=True --eval_interval=100 --max_iters=100`

From GPT2 Tokens

* `!cd ./nanoGPT && python train.py config/train_shakespeare_char.py --out_dir='out' --dataset=DisneyGPT --batch_size=12 --init_from='gpt2' --always_save_checkpoint=True --eval_interval=20 --max_iters=20`

### Run GPT

`!cd ./nanoGPT && python sample.py --num_samples=5 --max_new_tokens=20`

### Flags

`train.py` arguments explained:

* save model every 100 iters:

  * `--eval_interval=100`

* stop training after 300 iters:

  * `--max_iters=300`

* `--init_from='resume' # 'scratch' or 'resume' or 'gpt2*'`

* `--lr_decay_iters=2000 --max_iters=2000 # causes ZeroDivisionError decay=2001 temp solve`

* [baby GPT model](https://github.com/karpathy/nanoGPT/blob/master/config/train_shakespeare_char.py) `config/train_shakespeare_char.py`

* Only a MackBook!: `python train.py config/train_shakespeare_char.py --device=cpu --compile=False --eval_iters=20 --log_interval=1 --block_size=64 --batch_size=12 --n_layer=4 --n_head=4 --n_embd=128 --max_iters=2000 --lr_decay_iters=2000 --dropout=0.0`

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/eniompw/disneygpt

Awesome Lists containing this project

README