Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/miaoski/amis-safolu
蔡中涵委員阿美語字典
https://github.com/miaoski/amis-safolu
Last synced: 22 days ago
JSON representation
蔡中涵委員阿美語字典
- Host: GitHub
- URL: https://github.com/miaoski/amis-safolu
- Owner: miaoski
- Created: 2015-08-23T05:03:06.000Z (about 9 years ago)
- Default Branch: master
- Last Pushed: 2023-04-12T05:20:07.000Z (over 1 year ago)
- Last Synced: 2024-07-31T22:38:07.982Z (3 months ago)
- Language: Ruby
- Size: 81.2 MB
- Stars: 7
- Watchers: 6
- Forks: 4
- Open Issues: 4
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-g0v - amis-safolu - 阿美語萌典 (蔡中涵版本) (Open Data Open Gov / 開放資料、開放政府 / 公營服務(基礎建設、健康與醫療、教育與研究、服務要求與陳情))
README
# amis-safolu 阿美語萌典—蔡中涵大辭典 字典檔
## Warning for Deprecated Repo
蔡中涵字典的來源已經改到 https://github.com/g0v/amis-moedict/tree/master/docs/s 了。最新的修改必須從那個 repo 取得。
因此本 repo 的內容在 2022.3.20 之後 freeze 。造成不便敬請原諒。## 環境
* Ruby v2.6+
* bundler v2.0.1
* ActiveRecord v6.0.3.2
* SQLite3## 轉換 docx 到 html
透過 https://soffice.sheethub.net 轉換 docx 到 html。
```
$ cd tmp/docx目錄
$ ruby ../../docx-to-html.rb
```## 轉換 html 存到 sqlite
需要依序執行。
```
$ ruby parsing.rb # 從 html 存到 RawContent
$ ruby parsing-terms.rb # 從 RawContent 建立單詞和詞幹
$ ruby parsing-content.rb # 從 RawContent 建立定義、例句和關連詞
$ ruby clean-dummy-in-db.rb # 將資料庫裡的已知垃圾資訊清除
```## 從 sqlite 產生 json 單詞檔案
需要依序執行。
```
$ ruby generate-moedict-json.rb # 產生阿美語萌典需要的 json
$ ruby generate-ufff-code-to-example.rb # 將 \ufff9, \ufffa, \ufffb 加入例句
$ ruby link-json-to-terms.rb # 將定義、例句和關連詞的內容,用 `~ 包住,連結到對應詞
$ ruby generate-json-from-sqlite.rb # 產生單詞 json 檔案
```## 操作 model table
使用 ActiveRecord gem 來操作,目前專案使用 v6.0.1,相關指令放在 Rakefile。
```
$ rake g:migration YOUR_MIGRATION
$ rake db:migrate
$ rake db:rollback
$ rake db:schema
```使用 Annotate gem 的指令,將 table schema 更新到 model 檔案裡。
```
$ annotate --models --model-dir models
```# 致謝
感謝 cpyang 將 PDF 原稿轉為 TXT 檔。
舊版說明請看 [PREV_README](PREV_README.md)
# License
蔡中涵委員 g0v 阿美語萌典計劃使用本字典,以 CC BY-NC 授權宣告。