Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
awesome-nlp
:book: A curated list of resources dedicated to Natural Language Processing (NLP)
https://github.com/keon/awesome-nlp
Last synced: 1 day ago
JSON representation
-
研究摘要和趨勢
-
教學
-
閱讀內容
- 機器學習 101
- 繼器學習部落格
- 理解和實施自然語言處理
- Hackernoon 的自然語言處理簡介 - 用他們自己的話來說。
- 使用 Pytorch 進行自然語言處理的深度學習
- 深度學習, 自然語言處理, 與呈現法
- 圖解 BERT, ELMo, 與 co. (自然語言處理是如何破解遷移學習的) - transformer/)
- 自然語言處理
- Radim Řehůřek 的教學
- Karpathy 的遞歸神經網絡的不合理有效性
- Ruder's 部落格
- 動手做 NLTK 教學 - 以
- arXiv: 自然語言處理 (大部分) 來自 Scratch
- 自然語言處理: 一份簡介
- Vik Paruchari 的自然語言處理教學
- 自然語言處理: 一份簡介
-
影片和課程
- 人工智慧入門
- 深度學習
- 自然語言處理深度學習 (cs224-n)
- 自然語言處理
- 自然語言處理的神經網路
- 統計機器翻譯 - 機器翻譯課程,具有很棒的作業和投影片。
- 使用 Python 3 進行 NLTK 自然語言處理
- 計算語言學 I
- 深度自然語言處理
-
書籍
-
-
函式庫
-
書籍
- Twitter-text - 使用 JavaScript 實現的 Twitter 文本處理庫。
- TextBlob - 為專研常見的自然語言處理(NLP)任務提供一致的 API。 站在[自然語言工具包 (NLTK)](https://www.nltk.org/) 和 [模式](https://github.com/clips/pattern)膀上,並與兩者很好地配合 :+1:
- gensim - 用於從純文本進行無監督語義建模的 函式庫 :+1:
- Flair - 一個非常簡單的框架,用於在 PyTorch 上構建最先進的多語言 NLP。包括 BERT,ELMo 和 Flair 嵌入。
- CRFsuite - CRFsuite 實現用於標記順序數據的條件隨機字段(CRF)。
- Moses
- 斯坦福大學 NLP
- OpenNLP
- MALLET - 用於 LanguagE Toolkit 的機器學習 - 用於統計自然語言處理,文檔分類,聚類,主題建模,資訊提取和其他機器學習應用程序的文本包。
- Ruby 中實用的自然語言處理
-
服務
- Amazon 理解 - NLP 和 ML 套件涵蓋了最常見的任務,如 NER,標記和情感分析。
- ParallelDots - 高層次文本分析 API 服務,從情感分析到意圖分析。
- Microsoft 認知服務
- TextRazor
- Rosette
- Textalytic - 瀏覽器中的自然語言處理,包括情感分析,命名實體提取,POS標記,詞頻,主題建模,文字雲等。
- Rosette
-
註釋工具
-
-
技術
-
文本嵌入
- pdf - global-vectors-for-word-representation/) |
- 預訓練 fasttext 向量
- 詞向量的驚人力量
- arXiv: 高效文本分類的錦囊妙方
- 深度情境詞表示 - [PyTorch 實作](https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md) - [TF 實作](https://github.com/allenai/bilm-tf)
- 通用語言模型進行文本分類微調
- 自然語言推論資料的通用語句表示監督是學習
- 在翻譯中學習: 情境詞相量
- 文件與句子的分散式表達 - technologies.com/doc2vec-tutorial/)
- sense2vec - 關於詞義消歧。
- 跳過思考象量 - 單詞表示方法。
- 自適應 skip-gram - 類似的方法,具有自適應屬性。
-
回答問題與知識提取
-
-
自然語言處理-韓文
-
函式庫
- KoNLPy - 用於韓語自然語言處理的Python包。
- Mecab (Korean) - 韓文的自然語言處理 C++ 函式庫
- KoNLP - 韓文的自然語言處理 R 包。
- KoNLPy - 用於韓語自然語言處理的Python包。
-
部落格與教學
-
資料集
-
-
自然語言處理-阿拉伯語
-
函式庫
- PyArabic - 阿拉伯語的 Python 函式庫。
-
-
自然語言處理-印度語
-
資料, 文集與樹庫
- 印地語依賴樹庫 - 印地語和烏爾都語的多代表性多層樹庫。
- 在印地語的普遍依賴性樹庫
- 並行通用依賴樹庫印地語 - 上述樹庫的一小部分。
-
-
自然語言處理-泰語
-
函式庫
- 泰語工具包 - 基於 Wirote Aroonmanakun 於2002年撰寫的一篇論文,其中包括數據集。
-
資料
- Inter-BEST - 具有500萬個單詞分詞的文本語料庫。
- Prime Minister 29 - 數據集包含現任泰國總理的演講。
-
-
自然語言處理-越南語
-
資料
- 越南樹庫 - 選區解析任務的10,000個句子。
- BKTreeBank - 越南依賴樹庫。
- VIVOS - 一個免費的越南語言語料庫,由 AILab 的15小時錄音講話組成。
- VNTQcorpus(big).txt - 新聞中的175萬句話。
- BKTreeBank - 越南依賴樹庫。
-
-
自然語言處理-印度尼西亞
-
資料集
- ILPS
- 用於PoS標記的PANL10N
- Wordnet-Bahasa - 大型,免費的語義詞典。
-
函式庫與嵌入
-
-
其他語言
-
函式庫與嵌入
-
Programming Languages
Categories
Sub Categories
Keywords
nlp
3
ruby
2
natural-language-processing
2
machine-learning
2
rubynlp
1
rubyml
1
pos-tag
1
list
1
computational-linguistics
1
awesome-list
1
awesome
1
unicode
1
twitter-text
1
twitter
1
tweet
1
objective-c
1
nodejs
1
java
1
oxford
1
deep-learning
1
tutorials
1
tutorial
1
notebooks
1
notebook-jupyter
1
notebook
1
nltk3
1
nltk-library
1
nltk
1
nlp-resources
1
nlp-machine-learning
1
jupyter-notebooks
1
jupyter-notebook
1
jupyter
1
didactic
1
binder
1
sentiment-analysis
1
emoji
1