Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/yagays/ja-timex
自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器
https://github.com/yagays/ja-timex
datetime nlp python regular-expression temporal time-parsing
Last synced: about 1 month ago
JSON representation
自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器
- Host: GitHub
- URL: https://github.com/yagays/ja-timex
- Owner: yagays
- License: mit
- Created: 2021-07-19T12:51:35.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2024-01-27T11:11:48.000Z (11 months ago)
- Last Synced: 2024-09-18T10:42:49.681Z (3 months ago)
- Topics: datetime, nlp, python, regular-expression, temporal, time-parsing
- Language: Python
- Homepage:
- Size: 727 KB
- Stars: 132
- Watchers: 2
- Forks: 9
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- my-awesome-starred - yagays/ja-timex - 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器 (Python)
README
![](docs/docs/img/logo_title_wide.png)
# ja-timex
自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器
## 概要
`ja-timex` は、現代日本語で書かれた自然文に含まれる時間情報表現を抽出し`TIMEX3`と呼ばれるアノテーション仕様に変換することで、プログラムが利用できるような形に規格化するルールベースの解析器です。以下の機能を持っています。
- ルールベースによる日本語テキストからの日付や時刻、期間や頻度といった時間情報表現を抽出
- アラビア数字/漢数字、西暦/和暦などの多彩なフォーマットに対応
- 時間表現のdatetime/timedeltaオブジェクトへの変換サポート### 入力
```python
from ja_timex import TimexParsertimexes = TimexParser().parse("彼は2008年4月から週に3回のジョギングを、朝8時から1時間行ってきた")
```### 出力
```python
[,
,
,
]
```### datetime/timedeltaへの変換
```python
#
In []: timexes[0].to_datetime()
Out[]: DateTime(2008, 4, 1, 0, 0, 0, tzinfo=Timezone('Asia/Tokyo'))
``````python
#
In []: timexes[3].to_duration()
Out[]: Duration(hours=1)
```## インストール
```
pip install ja-timex
```## ドキュメント
[ja\-timex documentation](https://ja-timex.github.io/docs/)### 参考仕様
本パッケージは、以下の論文で提案されている時間情報アノテーションの枠組みを元に作成しています。- [1] [小西光, 浅原正幸, & 前川喜久雄. (2013). 『現代日本語書き言葉均衡コーパス』 に対する時間情報アノテーション. 自然言語処理, 20(2), 201-221.](https://www.jstage.jst.go.jp/article/jnlp/20/2/20_201/_article/-char/ja/)
- [2] [成澤克麻 (2014)「自然言語処理における数量表現の取り扱い」東北大学大学院 修士論文](http://www.cl.ecei.tohoku.ac.jp/publications/2015/mthesis2013_narisawa_submitted.pdf)