Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/kidneyweakx/fakenews_server
A chinese fakenews detected server
https://github.com/kidneyweakx/fakenews_server
flask python tesseract
Last synced: about 1 month ago
JSON representation
A chinese fakenews detected server
- Host: GitHub
- URL: https://github.com/kidneyweakx/fakenews_server
- Owner: kidneyweakx
- Created: 2020-07-21T12:58:10.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2020-11-21T17:57:20.000Z (about 4 years ago)
- Last Synced: 2024-10-14T06:36:19.933Z (3 months ago)
- Topics: flask, python, tesseract
- Language: HTML
- Homepage:
- Size: 2.17 MB
- Stars: 1
- Watchers: 2
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: readme.md
Awesome Lists containing this project
README
# Fakenews OCR Detect
*使用前請先閱讀該文件!!!!!*### 📎 基本說明
可使用圖片轉文字來偵測假新聞的伺服器實作。[範例網站](http://kidneyweakx.nctu.me/)
### 🛠 開發環境
- **IDE**: Visual Studio 2019 or VScode
- **Python**: Python 3.7.6 :: Anaconda, Inc on Win32
- **如果你是Linux環境**: 執行該檔案完成環境建置 [aptrequired.sh](./aptrequired.sh)
```[shell]
# 在終端機中執行該行指令
bash aptrequired.sh
```### 📜 功能列表
- Flask Server
- [x] [主畫面](./templates/index.html)
- [x] [上傳圖片](./templates/upload.html)
- [x] 圖形介面
- [x] CSS美化
- [x] 返回假新聞回饋功能
- Tesseract
- [x] [圖片轉文字(OCR)功能](./utils/tesseract.py)
- Texts Compare
- [x] [Flairs Model](./archives/ispam.py)
- [x] SpaCy 相似度比對
- [x] [假新聞比對](./utils/similar.py)
- [x] 真新聞比對
- [x] 比對加速
- [x] 與資料庫中資料做對比
- [x] 詞性情感比對
- [x] (備案) 假新聞辨識模型 (無中文版)
- Crawl
- [x] 爬取新聞資料
- [x] 自動爬取新增資料
- [x] 將爬取資料匯入資料庫
- Deploy
- [x] [UWSGI 部屬](./uwsgi.ini)
- [x] [Nginx 反向代理](./nginxsetting.txt)
- [x] AWS EC2 上線
- [x] HTTPS 安全性
- [ ] 穩定度測試### 🔔 環境執行前注意
- 需先下載 tesseract軟體 [Windows載點](https://tesseract-ocr.github.io/tessdoc/4.0-with-LSTM.html)
- [`tesseract.py`](./utils/tesseract.py) 根據你的tesseract應用程式下載位置更改 Line 7 值
``` [python]
# 先執行該行程式將所有依賴套件下載好
pip install -r requirement.txt
```
[Requirement.txt](./requirement.txt)
NOTE:*UWSGI可視情況不下載*
- [`spacy`](https://spacy.io/usage) download chinese(zh_core_web_sm)
``` [python]
# 語言包需額外下載
python -m spacy download zh_core_web_sm
```### 💻 執行
將爬取的CSV檔放入[data](./utils/data)資料夾便可執行
```[python]
# 執行該段後即可透過 localhost:port來瀏覽
python app.py
```### 🔧 依賴套件
*主要運用這些套件*
- [伺服器Flask](https://flask.palletsprojects.com/)
- [NLP套件SpaCy](https://spacy.io/)
- [OCR套件Tesseract](https://github.com/tesseract-ocr/tesseract/wiki)
- [資料處理Pandas](https://pandas.pydata.org/)