Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/sociocom/JMED-LLM
JMED-LLM: Japanese Medical Evaluation Dataset for Large Language Models
https://github.com/sociocom/JMED-LLM
Last synced: 3 months ago
JSON representation
JMED-LLM: Japanese Medical Evaluation Dataset for Large Language Models
- Host: GitHub
- URL: https://github.com/sociocom/JMED-LLM
- Owner: sociocom
- Created: 2024-07-11T10:57:02.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2024-07-30T09:14:25.000Z (4 months ago)
- Last Synced: 2024-07-30T12:25:11.575Z (4 months ago)
- Homepage:
- Size: 1.64 MB
- Stars: 10
- Watchers: 3
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
- awesome-japanese-llm - JMED-LLM
README
# JMED-LLM: Japanese Medical Evaluation Dataset for Large Language Models
日本語医療分野における大規模言語モデルの評価用データセットThis dataset is designed for evaluating large language models in the Japanese medical domain.
## 関連資料
- [JMED-LLM: 日本語医療LLM評価データセットの公開(2024/07/25)](https://speakerdeck.com/fta98/jmed-llm-ri-ben-yu-yi-liao-llmping-jia-detasetutonogong-kai)## Tasks/Datasets
|Task|Dataset|License|Original Dataset|
|---|---|---|---|
|文章分類|**CRADE**: Case Report Adverse Drug Event|CC-BY-4.0|NTCIR-16 Real-MedNLP (MedTxt-CR)|
||**RRTNM**: Radiology Reports Tumor Nodes Metastasis|CC-BY-4.0|NTCIR17 MedNLP-SC|
||**SMDIS**: Social Media Disease|CC-BY-4.0|NTCIR-13 MedWeb|
|質問応答|**JMMLU-Med**: Japanese Massive Multitask Language Understanding in Medical domain|CC-BY-SA-4.0|JMMLU|
|固有表現抽出|**MRNER-disease**: Medical Report Positive Disease Recognition|CC-BY-4.0|NTCIR-16 Real-MedNLP (MedTxt-CR, MedTxt-RR)|
||**MRNER-medicine**: Medical Report Medicine Recognition|CC-BY-4.0|NTCIR-16 Real-MedNLP (MedTxt-CR)|
||**NRNER**: Nursing Report Named Entity Recognition|CC-BY-NC-SA-4.0|NursingRecord_NERdataset|
|文章類似度|**JCSTS**: Japanese Clinical Semantic Textual Similarity|CC-BY-NC-SA-4.0|Japanese-Clinical-STS|### Description
#### 文章分類
全てのタスクは、100件づつのデータで構成されています。また、均衡なデータセットであるため、Accuracyなどのシンプルな評価指標で適切な評価が可能です。
- **CRADE**:
症例報告の薬品症状から有害事象(ADE)の可能性を分類
- **RRTNM**:
読影レポートから癌のTNMステージングを分類
- **SMDIS**:
模擬Tweetから病気や症状があるかを分類
#### 質問応答
- **JMMLU-Med**:
JMMLUに含まれる医療問題
#### 固有表現抽出
- **MRNER-disease**:
症例報告および読影レポートにおいて,患者に実際に認められた症状を抽出
- **MRNER-medicine**:
症例報告および読影レポートにおいて,薬品に関する情報を抽出
- **NRNER**:
模擬看護記録からの固有表現抽出
#### 文章類似度
- **JCSTS**:
2つの臨床テキストから文章類似度を分類## How to build prompt (example)
### 文章分類、多肢選択式問題、文章類似度
```python
import pandas as pddef build_user_prompt(question, options):
user_prompt = f"質問: {question}\n選択肢:\n"
alphabet = ["A", "B", "C", "D", "E", "F"]
for i, option in enumerate(options):
user_prompt += f"{alphabet[i]}. {option}\n"
return user_promptdf = pd.read_csv(dataset_path)
df["options"] = df.filter(regex="option[A-F]").apply(lambda x: x.dropna().tolist(), axis=1)system_prompt = "与えられた医学に関する質問と選択肢から、最も適切な回答を選択してください。なお、回答には選択肢のアルファベット(例:A)のみを含め、他には何も含めないことを厳守してください。"
for question, options in zip(df["question"], df["options"]):
user_prompt = build_user_prompt(question, options)
messages = [
{"role": "system", "content": system_prompt},
{"role": "user", "content": user_prompt},
]
... # Generate answer using LLM
```
### 固有表現抽出
```python
import pandas as pddf = pd.read_csv(dataset_path)
system_prompt = "与えられた医学に関する質問から、最も適切な回答をしてください。なお、回答にはPythonのリスト形式(例:[\"回答1\", \"回答2\"])のみを含め、他には何も含めないことを厳守してください。"for question in df["question"]:
user_prompt = question
messages = [
{"role": "system", "content": system_prompt},
{"role": "user", "content": user_prompt},
]
... # Generate answer using LLM
```## License
The license for each dataset follows the terms of the original dataset's license. All other components are licensed under a Creative Commons Attribution 4.0 International License.