Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

ATPapers

Worth-reading papers and related resources on attention mechanism, Transformer and pretrained language model (PLM) such as BERT. 值得一读的注意力机制、Transformer和预训练语言模型论文与相关资源集合
https://github.com/ZhengZixiang/ATPapers

Last synced: 6 days ago
JSON representation

Attention
- English Blog
- Repositories
  - thushv89 / Keras Attention Layer - Keras Layer implementation of Attention
- Chinese Blog
- Papers
  - [paper - ***Hard & Soft Attention***
  - [paper - ***Global & Local Attention***
  - [paper
  - [paper - nonlocal-net)
  - [paper
  - [paper
  - [paper - ***Bi-BloSAN***
  - [paper - attention)
  - [paper - pytorch)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - analysis-of-transformer)
  - [paper
- Survey & Review
  - [paper
Transformer
- Repositories
  - DongjunLee / transformer-tensorflow - Transformer Tensorflow implementation
  - andreamad8 / Universal-Transformer-Pytorch - Universal Transformer PyTorch implementation
  - lucidrains / Linear Attention Transformer - Transformer based on a variant of attention that is linear complexity in respect to sequence length
  - sannykim / transformers - A collection of resources to study Transformers in depth
  - PapersWithCode / Attention
- Chinese Blog
- Papers
  - [paper - pytorch)
  - [paper
  - [paper - han-lab/lite-transformer)
  - [paper
  - [paper
  - [paper - Transformer)
  - [paper - research/google-research/tree/master/routing_transformer)
  - [paper - han-lab/hardware-aware-transformers)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - transformers)[[project]](https://linear-transformers.com/)
  - [paper - Transformer)
  - [paper - transformers)
  - [paper
  - [paper - attention)
  - [paper
  - [paper
  - [paper - research/google-research/tree/master/performer/fast_self_attention)[[pytorch version]](https://github.com/lucidrains/performer-pytorch)[[blog]](https://ai.googleblog.com/2020/10/rethinking-attention-with-performers.html)
  - [paper - research/long-range-arena)
  - [paper - nmt)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - ***MAN***
  - [paper - is-all-you-need-pytorch) - ***Transformer***
  - [paper
  - [paper - aan) - ***AAN***
  - [paper - MT/THUMT/blob/d4cb62c215d846093e5357aa17b286506b2df1af/thumt/layers/attention.py)
  - [paper - Transformer-Pytorch)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - Sparse-Transformer)
  - [paper - transformer-pytorch)
- English Blog
Pretrained Language Model
- Models
  - [paper - ***SpanBERT***
  - [paper - ***XLNet***
  - [paper - ***RoBERTa***
  - [paper - ***GPT***
  - [paper - 2) - ***GPT-2***
  - [paper - ***MASS***
  - [paper - ***UNILM***
  - [paper - dnn) - ***MT-DNN***
  - [paper - ***UDify***
  - [paper - ***Grover***
  - [paper - ***ERNIE 2.0 (Baidu)***
  - [paper - ***Chinese-BERT-wwm***
  - [paper - ***SpanBERT***
  - [paper - ***XLNet***
  - [paper - ***RoBERTa***
  - [paper - noah/Pretrained-Language-Model) - ***NEZHA***
  - [paper - LM) - ***Megatron-LM***
  - [paper - research/text-to-text-transfer-transformer) - ***T5***
  - [paper - ***BART***
  - [paper - ***ZEN***
  - [paper - aig/nlp_baai) - ***BAAI-JDAI-BERT***
  - [paper - py) - ***UER***
  - [paper - ***ELECTRA***
  - [paper - ***StructBERT***
  - [paper - ***FreeLB***
  - [paper - ***HUBERT***
  - [paper - ***ProphetNet***
  - [paper - gen) - ***ERNIE-GEN***
  - [paper - ***StackingBERT***
  - [paper - BERT)
  - [paper - ***Meena***
  - [paper - ***UNILMv2***
  - [paper - ***Optimus***
  - [paper
  - [paper - ***MPNet***
  - [paper - 3) - ***GPT-3***
  - [paper - ***SPECTER***
  - [paper - of-the-art-open-source-chatbot/)[[code]](https://github.com/facebookresearch/ParlAI) - ***Blender***
  - [paper - -kHuAI1V8oLRQ) - ***MacBERT***
  - [paper - 2) - ***PLATO-2***
  - [paper - ***DeBERTa***
  - [paper - opensource/ConvBert)
  - [paper
  - [paper - uxn38aFvjPNiwWGw)
  - [paper
  - [paper
  - [paper - ***GLM***
- Application
  - [paper & code - ***Keyword BERT***
  - [paper
  - [paper
  - [paper
  - [paper - transformers)
  - [paper
  - [paper
  - [paper
  - [paper - BERT)
  - [paper - ***Soft-Masked BERT***
  - [paper - ***DeFormer***
  - [paper - research/bleurt) - ***BLEURT***
  - [paper
  - [paper
  - [paper
- Repository
  - bojone / bert4keras - bojone's (苏神) BERT Keras implementation
  - brightmart / albert_zh - 海量中文预训练ALBERT模型
  - brightmart / roberta_zh - RoBERTa中文预训练模型
  - CyberZHG / keras-bert - CyberZHG's BERT Keras implementation
  - Ethan-yt / GuwenBERT - A Pre-trained Language Model for Classical Chinese (Literary Chinese)
  - graykode / gpt-2-Pytorch - Simple Text-Generator with OpenAI gpt-2 Pytorch Implementation
  - heartcored98 / Transformer_Anatomy - Toolkit for finding and analyzing important attention heads in transformer-based models
  - Hironsan / bertsearch - Elasticsearch with BERT for advanced document search
  - CLUEbenchmark / CLUE - Chinese Language Understanding Evaluation Benchmark
  - jessevig / bertviz - BERT Visualization Tool
  - Jiakui / awesome-bert - Collect BERT related resources
  - legacyai / tf-transformers - State of the art faster Natural Language Processing in Tensorflow 2.0
  - Morizeyao / GPT2-Chinese - Chinese version of GPT2 training code, using BERT tokenizer
  - Separius / BERT-keras - Separius' BERT Keras implementation
  - policeme / roberta-wwm-base-distill - A chinese Roberta wwm distillation model which was distilled from roberta-ext-wwm-large
  - terrifyzhao / bert-utils - One line generate BERT's sent2vec for classification or matching task
  - Tencent / TurboTransformers - A fast and user-friendly runtime for transformer inference on CPU and GPU
  - THUNLP / OpenCLaP - Open Chinese Language Pre-trained Model Zoo
  - THUNLP / PLMpapers - Must-read Papers on pre-trained language models.
  - THUNLP-AIPoet / BERT-CCPoem - A BERT-based pre-trained model particularly for Chinese classical poetry
  - tomohideshibata / BERT-related-papers - This is a list of BERT-related papers.
  - TsinghuaAI / CPM-Generate - Chinese Pre-Trained Language Models (CPM-LM) Version-I
  - valuesimplex / FinBERT
  - ymcui / Chinese-XLNet - Pre-Trained Chinese XLNet（中文XLNet预训练模型）
  - ZhuiyiTechnology / pretrained-models - Open Language Pre-trained Model Zoo
  - ZhuiyiTechnology / SimBERT - A bert for retrieval and generation
  - ZhuiyiTechnology / WoBERT
  - ZhuiyiTechnology / t5-pegasus - 中文生成式预训练模型
  - bojone / albert_zh - 转换brightmart版的albert权重到Google版格式
  - CLUEbenchmark / CLUEPretrainedModels - 高质量中文预训练模型集合：最先进大模型、最快小模型、相似度专门模型
  - ymcui / Chinese-ELECTRA - Pre-trained Chinese ELECTRA（中文ELECTRA预训练模型）
- English Blog
- Multi-Modal
  - [paper
  - [paper
  - [paper - BERT)
  - [paper
  - [paper - BERT)
  - [paper
  - [paper - ***VILLA***
  - [paper
  - [paper - ***CBT***
  - [paper
  - [paper
  - [paper - research/language/tree/master/language/question_answering/b2t2) - ***B2T2***
  - [paper
  - [paper
  - [paper
- Multilingual
  - [paper - ***XLM***
  - [paper - ***XLM-R***
  - [paper - ***mBART***
  - [paper - waves/multifit)
  - [paper - research/xtreme)
  - [paper - ***MARGE***
  - [paper
  - [paper - ***LaBSE***
  - [paper - ***mRASP***
  - [paper - research/multilingual-t5)
  - [paper
- Knowledge
  - [paper
  - [paper
  - [paper - ***KnowBert***
  - [paper - BERT)
  - [paper - KEG/KEPLER)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
- Compression & Accelerating
  - [paper
  - [paper - ***MKDM***
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - ***BERT-PKD***
  - [paper
  - [paper
  - [paper
  - [paper - research/ALBERT)
  - [paper
  - [paper - ***LayerDrop***
  - [paper
  - [paper
  - [paper - ***AdaBERT***
  - [paper - of-Theseus)[[tf code]](https://github.com/qiufengyuyi/bert-of-theseus-tf)[[keras code]](https://github.com/bojone/bert-of-theseus)
  - [paper
  - [paper
  - [paper - research/google-research/tree/master/mobilebert)
  - [paper - ***BiLSTM-SRA & LTD-BERT***
  - [paper
  - [paper
  - [paper
  - [paper - ***Bort***
  - [paper
  - [paper - EMD)[[blog]](https://mp.weixin.qq.com/s/w1sT126jS_lZ_Q3cRi6fGQ)
  - [paper
  - [paper - RdGEtwxUdigNeEGJM987Q)
- Analysis & Tools
  - [paper - dnn/tree/master/alum)
  - [paper - study)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - analysis)
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - ***TextFooler***
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper
  - [paper - ***RIPPLe***
  - [paper - ***Transformer Anatomy***
  - [paper
  - [paper
  - [paper - stop-pretraining)
  - [paper
  - [paper - Masking)[[keras code]](https://github.com/bojone/perturbed_masking)
  - [paper - ***TUPE***
  - [paper
  - [paper
  - [paper - ***PET***
  - [paper
  - [paper
  - [paper
  - [paper - Yt91Sg)
  - [paper
  - [paper - Semi-Supervised-Learning-for-Text-Classification)[[blog]](https://mp.weixin.qq.com/s/t7a_1cf1EFuoTYnm2gAYSw)
  - [paper - Chen/RecAdam)[[blog]](https://mp.weixin.qq.com/s/M89mqFxa7_iK3lzlEgLzAQ)
  - [paper
  - [paper - shot-lm-learning)
  - [paper - flow)
  - [paper
  - [paper
- Chinese Blog
- Tutorial & Survey
  - [paper
  - [paper
  - [slides
  - [slides
  - [paper
  - [book

Programming Languages

Python 27 C++ 1 Jupyter Notebook 1

Ecosyste.ms: Awesome

ATPapers

Attention

English Blog

Repositories

Chinese Blog

Papers

Survey & Review

Transformer

Repositories

Chinese Blog

Papers

English Blog

Pretrained Language Model

Models

Application

Repository

English Blog

Multi-Modal

Multilingual

Knowledge

Compression & Accelerating

Analysis & Tools

Chinese Blog

Tutorial & Survey