An open API service indexing awesome lists of open source software.

https://github.com/ralgond/nlp_homework

(天池)零基础入门NLP
https://github.com/ralgond/nlp_homework

Last synced: 7 months ago
JSON representation

(天池)零基础入门NLP

Awesome Lists containing this project

README

          

# nlp_homework
零基础入门NLP

## 第一章 - 文本多分类任务

### 第一节 - 赛题背景

https://tianchi.aliyun.com/competition/entrance/531810/introduction

### 第二节 - Task3 基于机器学习的文本分类

https://github.com/ralgond/nlp_homework/blob/main/task3_hw1_tfidf.py

https://github.com/ralgond/nlp_homework/blob/main/task3_hw2_tfidf.py

### 第三节 - Task4 基于深度学习的文本分类1

https://github.com/ralgond/nlp_homework/blob/main/task4_hw1_fasttext.py

### 第四节 - Task5 基于深度学习的文本分类2-1 - Word2Vec

https://github.com/ralgond/nlp_homework/blob/main/task5_hw1_word2vec.py

这个作业的结果是一个文本,word2vec.txt,将会被用到后面的深度学习模型中。

### 第五节 - Task5 基于深度学习的文本分类2-2 - Word2Vec + LSTM

https://github.com/ralgond/nlp_homework/blob/main/task5_hw2_word2vec_lstm.py

这个作业依赖了上面提到过的word2vec.txt。

作业的离线结果是94.62%(accuracy)。线上分数为0.9351(F1)。

### 第六节 - Task7 基于深度学习的文本分类3-1 - CNN + LSTM

https://github.com/ralgond/nlp_homework/blob/main/task7_hw1_cnn_lstm.py

线上分数为0.9375(F1)。