Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
awesome-nlp
https://github.com/harddownloader/awesome-nlp
Last synced: 4 days ago
JSON representation
-
教學
-
影片和課程
-
閱讀內容
-
書籍
-
-
研究摘要和趨勢
-
Prominent NLP Research Labs
- The Berkeley NLP Group - Notable contributions include a tool to reconstruct long dead languages, referenced [here](https://www.bbc.com/news/science-environment-21427896) and by taking corpora from 637 languages currently spoken in Asia and the Pacific and recreating their descendant.
- Language Technologies Institute, Carnegie Mellon University - Notable projects include [Avenue Project](http://www.cs.cmu.edu/~avenue/), a syntax driven machine translation system for endangered lnaguages like Quechua and Aymara and previously, [Noah's Ark](http://www.cs.cmu.edu/~ark/) which created [AQMAR](http://www.cs.cmu.edu/~ark/AQMAR/) to imporve NLP tools for Arabic.
- NLP research group, Columbia University - Responsible for creating BOLT ( interactive error handling for speech translation systems) and an un-named project to characterize laughter in dialogue.
- The Center or Language and Speech Processing, John Hopkins University - Recently in the news for developing speech recognition software to create a diagnostic test or Parkinson's Disease, [here](https://www.clsp.jhu.edu/2019/03/27/speech-recognition-software-and-machine-learning-tools-are-being-used-to-create-diagnostic-test-for-parkinsons-disease/#.XNFqrIkzYdU).
- Computational Linguistics and Information Processing Group, University of Maryland - Notable contributions include [Human-Computer Cooperation or Word-by-Word Question Answering](http://www.umiacs.umd.edu/~jbg/projects/IIS-1652666) and modeling development of phonetic representations.
- Penn Natural Language Processing, University of Pennsylvania - Famous for creating the [Penn Treebank](http://www.cis.upenn.edu/~treebank/).
- The Stanford Nautral Language Processing Group - One of the top NLP research labs in the world, notable for creating [Stanford CoreNLP](https://nlp.stanford.edu/software/corenlp.shtml) and their [coreference resolution system](https://nlp.stanford.edu/software/dcoref.shtml)
-
函式庫
-
書籍
- Twitter-text - 使用 JavaScript 實現的 Twitter 文本處理庫。
- CRFsuite - CRFsuite 實現用於標記順序數據的條件隨機字段(CRF)。
- 斯坦福大學 NLP
- OpenNLP
- Ruby 中實用的自然語言處理
- gensim - 用於從純文本進行無監督語義建模的 函式庫 :+1:
-
服務
- Amazon 理解 - NLP 和 ML 套件涵蓋了最常見的任務,如 NER,標記和情感分析。
- ParallelDots - 高層次文本分析 API 服務,從情感分析到意圖分析。
- TextRazor
- Textalytic - 瀏覽器中的自然語言處理,包括情感分析,命名實體提取,POS標記,詞頻,主題建模,文字雲等。
-
註釋工具
-
-
技術
-
文本嵌入
- pdf - global-vectors-for-word-representation/) |
- 通用語言模型進行文本分類微調
- 預訓練 fasttext 向量
- 詞向量的驚人力量
- arXiv: 高效文本分類的錦囊妙方
- 深度情境詞表示 - [PyTorch 實作](https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md) - [TF 實作](https://github.com/allenai/bilm-tf)
- 自然語言推論資料的通用語句表示監督是學習
- 在翻譯中學習: 情境詞相量
- 文件與句子的分散式表達 - technologies.com/doc2vec-tutorial/)
- sense2vec - 關於詞義消歧。
- 跳過思考象量 - 單詞表示方法。
- 自適應 skip-gram - 類似的方法,具有自適應屬性。
-
回答問題與知識提取
- 基於模板的資訊提取沒有用到模板
- 矩陣分解與通用模式的關係提取
- 教學機器閱讀和理解 - DeepMind paper
- MLN 教學的演示投影片
- MLNs 的 QA 應用演示投影片
- 演示投影片
-
-
自然語言處理-韓文
-
函式庫
- Mecab (Korean) - 韓文的自然語言處理 C++ 函式庫
-
部落格與教學
-
資料集
-
-
自然語言處理-阿拉伯語
-
函式庫
- PyArabic - 阿拉伯語的 Python 函式庫。
-
-
自然語言處理-印度語
-
資料, 文集與樹庫
- 印地語依賴樹庫 - 印地語和烏爾都語的多代表性多層樹庫。
- 在印地語的普遍依賴性樹庫
-
-
NLP in Indic languages
-
Data, Corpora and Treebanks
-
Language Models and Word Embeddings
- IIT Patna Bilingual Word Embeddings Hi-En
- Hindi2Vec - for-hindi](https://github.com/goru001/nlp-for-hindi) ULMFIT style languge model
- Fasttext word embeddings in a whole bunch of languages, trained on Common Crawl
-
Libraries and Tooling
-
-
自然語言處理-泰語
-
資料
- Prime Minister 29 - 數據集包含現任泰國總理的演講。
- Inter-BEST - 具有500萬個單詞分詞的文本語料庫。
-
-
自然語言處理-越南語
-
資料
- BKTreeBank - 越南依賴樹庫。
- VIVOS - 一個免費的越南語言語料庫,由 AILab 的15小時錄音講話組成。
-
-
自然語言處理-印度尼西亞
-
函式庫與嵌入
-
資料集
-
-
其他語言
-
函式庫與嵌入
-
Programming Languages
Categories
Sub Categories
Keywords
nlp
3
machine-learning
2
natural-language-processing
2
ruby
2
pos-tag
1
list
1
computational-linguistics
1
awesome-list
1
awesome
1
unicode
1
twitter-text
1
twitter
1
tweet
1
objective-c
1
nodejs
1
java
1
emoji
1
oxford
1
tutorials
1
tutorial
1
notebooks
1
notebook-jupyter
1
notebook
1
nltk3
1
nltk-library
1
nltk
1
nlp-resources
1
nlp-machine-learning
1
jupyter-notebooks
1
jupyter-notebook
1
jupyter
1
didactic
1
binder
1
sentiment-analysis
1
rubynlp
1
rubyml
1
deep-learning
1