Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/lucidrains/n-grammer-pytorch

Implementation of N-Grammer, augmenting Transformers with latent n-grams, in Pytorch
https://github.com/lucidrains/n-grammer-pytorch

artificial-intelligence deep-learning memory n-gram transformers

Last synced: 19 days ago
JSON representation

Implementation of N-Grammer, augmenting Transformers with latent n-grams, in Pytorch

Host: GitHub
URL: https://github.com/lucidrains/n-grammer-pytorch
Owner: lucidrains
License: mit
Created: 2021-11-28T17:53:24.000Z (almost 3 years ago)
Default Branch: main
Last Pushed: 2022-12-04T22:47:53.000Z (almost 2 years ago)
Last Synced: 2024-10-23T13:34:50.254Z (28 days ago)
Topics: artificial-intelligence, deep-learning, memory, n-gram, transformers
Language: Python
Homepage:
Size: 189 KB
Stars: 72
Watchers: 7
Forks: 1
Open Issues: 1
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

        

## N-Grammer - Pytorch

Implementation of N-Grammer, augmenting Transformers with latent n-grams, in Pytorch

## Install

```bash

$ pip install n-grammer-pytorch

````

## Usage

```python

import torch

from n_grammer_pytorch import VQNgrammer

vq_ngram = VQNgrammer(

    num_clusters = 1024,             # number of clusters

    dim_per_head = 32,               # dimension per head

    num_heads = 16,                  # number of heads

    ngram_vocab_size = 768 * 256,    # ngram vocab size

    ngram_emb_dim = 16,              # ngram embedding dimension

    decay = 0.999                    # exponential moving decay value

)

x = torch.randn(1, 1024, 32 * 16)

vq_ngram(x) # (1, 1024, 32 * 16)

```

## Learning Rates

Like product key memories, Ngrammer parameters need to have a higher learning rate (`1e-2` was recommended in the paper). The repository offers an easy way to generate the parameter groups.

```python

from torch.optim import Adam

from n_grammer_pytorch import get_ngrammer_parameters

# this helper function, for your root model, finds all the VQNgrammer models and the embedding parameters

ngrammer_parameters, other_parameters = get_ngrammer_parameters(transformer)

optim = Adam([

    {'params': other_parameters},

    {'params': ngrammer_parameters, 'lr': 1e-2}

], lr = 3e-4)

```

Or, even more simply

```python

from torch.optim import Adam

from n_grammer_pytorch import get_ngrammer_param_groups

param_groups = get_ngrammer_param_groups(model) # automatically creates array of parameter settings with learning rate set at 1e-2 for ngrammer parameter values

optim = Adam(param_groups, lr = 3e-4)

```

## Citations

```bibtex

@inproceedings{thai2020using,

    title   = {N-grammer: Augmenting Transformers with latent n-grams},

    author  = {Anonymous},

    year    = {2021},

    url     = {https://openreview.net/forum?id=GxjCYmQAody}

}

```