https://github.com/temperedscarf9/transformer
Transformer架构这五年来深受人们重视。 本文是以逐行代码的形式对原论文进行注释的版本。 本文对原论文一部分章节进行了重新排序和删除,并在整个文档中添加了注释。 本文本身是一个可以运行的笔记(ipynb),理论上完全可以直接复现
https://github.com/temperedscarf9/transformer
nmt pytorch spacy transformer
Last synced: 10 months ago
JSON representation
Transformer架构这五年来深受人们重视。 本文是以逐行代码的形式对原论文进行注释的版本。 本文对原论文一部分章节进行了重新排序和删除,并在整个文档中添加了注释。 本文本身是一个可以运行的笔记(ipynb),理论上完全可以直接复现
- Host: GitHub
- URL: https://github.com/temperedscarf9/transformer
- Owner: Temperedscarf9
- Created: 2024-11-17T12:52:17.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2024-11-17T13:25:15.000Z (about 1 year ago)
- Last Synced: 2025-03-18T05:32:42.777Z (10 months ago)
- Topics: nmt, pytorch, spacy, transformer
- Language: Jupyter Notebook
- Homepage:
- Size: 1010 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
对[Attention Is All You Need](https://arxiv.org/pdf/1706.03762.pdf)论文的从零实现,主要任务为语言翻译,翻译任务为英–>德,所用数据集为[Multi30k(2016)](https://github.com/neychev/small_DL_repo/blob/master/datasets/Multi30k)