https://github.com/ufcpp/unicodedatacsharp
Parsing UCD in C#
https://github.com/ufcpp/unicodedatacsharp
Last synced: 6 months ago
JSON representation
Parsing UCD in C#
- Host: GitHub
- URL: https://github.com/ufcpp/unicodedatacsharp
- Owner: ufcpp
- License: mit
- Created: 2019-11-11T10:35:09.000Z (about 6 years ago)
- Default Branch: master
- Last Pushed: 2019-11-20T01:16:23.000Z (about 6 years ago)
- Last Synced: 2025-03-27T20:46:23.183Z (10 months ago)
- Language: C#
- Size: 63.5 KB
- Stars: 1
- Watchers: 2
- Forks: 0
- Open Issues: 8
-
Metadata Files:
- Readme: readme.md
- License: LICENSE
Awesome Lists containing this project
README
# UCD 読み込み
C# から Unicode の各種プロパティを読むためのコード。
ICU.net とか [ICU](http://site.icu-project.org/home)の DllImport とかいろいろ試してみたけど、結局、[unicode.org の UCD](http://unicode.org/reports/tr44/) を自前で読み込んで各行を parse する方が楽だってなって書いたコード。
面倒になったのは主に以下の2点。
- ICU バージョンと Unicode バージョンの対応を調べるのが面倒
- UCD のどのファイルのどの列が、ICU のどのメソッドから取れるか調べるのが面倒
UCD のデータは Glyph がらみを除けば全部テキストで、だいたいは
- `;` 区切り
- `#` から後ろはコメント
- コードポイントは16進数表記
- コードポイントの区間を表す場合、`..` で2つの16進数をつなぐ
という感じなので、そんなに複雑なことは必要ない。