https://github.com/ralgond/nlp_homework
(天池)零基础入门NLP
https://github.com/ralgond/nlp_homework
Last synced: 7 months ago
JSON representation
(天池)零基础入门NLP
- Host: GitHub
- URL: https://github.com/ralgond/nlp_homework
- Owner: ralgond
- License: apache-2.0
- Created: 2024-09-14T07:57:39.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2024-09-23T08:47:35.000Z (about 1 year ago)
- Last Synced: 2025-01-09T06:47:00.824Z (9 months ago)
- Language: Python
- Homepage:
- Size: 70.3 KB
- Stars: 0
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# nlp_homework
零基础入门NLP## 第一章 - 文本多分类任务
### 第一节 - 赛题背景
https://tianchi.aliyun.com/competition/entrance/531810/introduction
### 第二节 - Task3 基于机器学习的文本分类
https://github.com/ralgond/nlp_homework/blob/main/task3_hw1_tfidf.py
https://github.com/ralgond/nlp_homework/blob/main/task3_hw2_tfidf.py
### 第三节 - Task4 基于深度学习的文本分类1
https://github.com/ralgond/nlp_homework/blob/main/task4_hw1_fasttext.py
### 第四节 - Task5 基于深度学习的文本分类2-1 - Word2Vec
https://github.com/ralgond/nlp_homework/blob/main/task5_hw1_word2vec.py
这个作业的结果是一个文本,word2vec.txt,将会被用到后面的深度学习模型中。
### 第五节 - Task5 基于深度学习的文本分类2-2 - Word2Vec + LSTM
https://github.com/ralgond/nlp_homework/blob/main/task5_hw2_word2vec_lstm.py
这个作业依赖了上面提到过的word2vec.txt。
作业的离线结果是94.62%(accuracy)。线上分数为0.9351(F1)。
### 第六节 - Task7 基于深度学习的文本分类3-1 - CNN + LSTM
https://github.com/ralgond/nlp_homework/blob/main/task7_hw1_cnn_lstm.py
线上分数为0.9375(F1)。