{"id":49600523,"url":"https://github.com/elecbug/han-graph","last_synced_at":"2026-05-04T09:04:33.286Z","repository":{"id":355248648,"uuid":"1072790727","full_name":"elecbug/han-graph","owner":"elecbug","description":"漢-Graph(HAN-GRAPH)는 한자 기반 한국어 단어를 네트워크 그래프 형태로 구축하고, 이를 기반으로 외국인 학습자의 한국어 이해 능력을 향상시키기 위한 프로젝트입니다.","archived":false,"fork":false,"pushed_at":"2026-05-02T16:35:35.000Z","size":287,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":0,"default_branch":"master","last_synced_at":"2026-05-02T17:24:49.182Z","etag":null,"topics":["graph-theory","korea","korean","korean-language"],"latest_commit_sha":null,"homepage":"","language":"Go","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"other","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/elecbug.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2025-10-09T08:08:40.000Z","updated_at":"2026-05-02T16:35:39.000Z","dependencies_parsed_at":null,"dependency_job_id":null,"html_url":"https://github.com/elecbug/han-graph","commit_stats":null,"previous_names":["elecbug/han-graph"],"tags_count":null,"template":false,"template_full_name":null,"purl":"pkg:github/elecbug/han-graph","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elecbug%2Fhan-graph","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elecbug%2Fhan-graph/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elecbug%2Fhan-graph/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elecbug%2Fhan-graph/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/elecbug","download_url":"https://codeload.github.com/elecbug/han-graph/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/elecbug%2Fhan-graph/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":32600968,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-05-03T22:12:39.696Z","status":"online","status_checked_at":"2026-05-04T02:00:06.625Z","response_time":58,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["graph-theory","korea","korean","korean-language"],"created_at":"2026-05-04T09:04:32.207Z","updated_at":"2026-05-04T09:04:33.280Z","avatar_url":"https://github.com/elecbug.png","language":"Go","funding_links":[],"categories":[],"sub_categories":[],"readme":"# 漢-Graph\n\n漢-Graph(HAN-GRAPH)는 한자 기반 한국어 단어를 네트워크 그래프 형태로 구축하고, 이를 기반으로 외국인 학습자의 한국어 이해 능력을 향상시키기 위한 프로젝트입니다.\n\n본 프로젝트는 단순한 한자 사전이나 단어 암기 프로그램이 아니라,\n학습자가 처음 보는 한국어 단어를 스스로 분해하고 추론하는 능력을 기르는 것을 핵심 목표로 합니다.\n\n---\n\n## 프로젝트 목적\n\n본 프로젝트는 다음과 같은 목적을 갖습니다.\n\n1. 비 한자권 외국인의 한국어 구성 중심 학습을 위한 데이터베이스 구축\n2. 두 글자 이상의 한자어 조합으로 이루어진 한국어의 네트워크 그래프 구조 분석\n3. 한자 기반 단어 연결 구조의 그래프 이론적 특성 연구\n4. 외국인 학습자의 \"미지 단어 추론 능력\" 향상\n5. ~~내 한자 공부~~\n\n기타 자세한 내용은 [docs](./docs/) 항목을 참조해 주세요.\n\n*본 프로젝트는 나의 소중한 여자친구 I. I. K. Sobirova를 위해 시작되었습니다.*\n\n---\n\n## 프로젝트 배경\n\n한국어 능력시험(TOPIK) 중급 이상의 학습자들 중에는 상당한 어휘력을 갖고 있음에도 불구하고, 처음 보는 단어를 구성 요소 단위로 분석하지 못하는 경우가 존재합니다.\n\n예를 들어 학습자가 `분수`라는 단어를 처음 본다고 가정합니다.\n\n### 경우 1 — 단어 전체를 모르는 경우\n\n학습자는 `분수`를 하나의 새로운 문자열로만 인식합니다.\n\n```text\n분수 = ??? (모르는 단어)\n```\n\n이 경우 문맥이 없으면 의미 추론이 어렵습니다.\n\n---\n\n### 경우 2 — 한자 구성 기반으로 이해하는 경우\n\n학습자는 다음과 같이 접근합니다.\n\n```text\n분 = divide / spray\n수 = water / number\n```\n\n그리고 문맥을 바탕으로:\n\n```text\n分數 = 나눈 수 → fraction\n噴水 = 물을 뿜음 → fountain\n```\n\n과 같이 의미를 추론할 수 있습니다.\n\n본 프로젝트는 바로 이 능력, 즉:\n\n\u003e \"처음 보는 한국어 단어를 구성 요소 단위로 분석하고 의미를 추론하는 능력\"\n\n을 강화하는 것을 목표로 합니다.\n\n---\n\n## 핵심 아이디어\n\n### 1. 단어는 그래프이다\n\n한국어 한자어는 독립된 단어들의 집합이 아니라, 서로 연결된 의미 네트워크입니다.\n\n예를 들어:\n\n```text\n文化 = 문화\n文學 = 문학\n文字 = 문자\n文法 = 문법\n```\n\n은 모두 `文`이라는 공통 개념을 공유합니다.\n\n또한:\n\n```text\n電話 = 전기 + 말\n水道 = 물 + 길\n火山 = 불 + 산\n```\n\n과 같은 구조는 조합적 의미 추론을 가능하게 만듭니다.\n\n본 프로젝트는 이러한 구조를 그래프 형태로 저장합니다.\n\n---\n\n### 2. 데이터는 단어 중심으로 구축한다\n\n본 프로젝트는 \"한자별 예문 수집\" 방식보다,\n\"단어 기반 데이터베이스 구축\" 방식을 채택합니다.\n\n예를 들어:\n\n```json\n{\n  \"word\": \"문화\",\n  \"hanja\": \"文化\",\n  \"meaning_en\": \"culture\"\n}\n```\n\n라는 단어 하나는 자동으로:\n\n```text\n文 네트워크\n化 네트워크\n```\n\n양쪽에 동시에 연결됩니다.\n\n즉:\n\n```text\n단어 데이터 구축\n→ 자동 역색인\n→ 한자 그래프 생성\n```\n\n구조를 사용합니다.\n\n---\n\n## 데이터 구조\n\n### 1. 한자 데이터\n\n각 한자는 다음과 같은 구조를 가집니다.\n\n```json\n{\n  \"type\": \"character\",\n  \"id\": \"hwa002\",\n  \"hanja\": \"火\",\n  \"meaning_ko\": [\"불\"],\n  \"meaning_en\": [\"fire\"]\n}\n```\n\n특징:\n\n* 음별(meta) 그룹 존재\n* 중등 한자: `000~099`\n* 고등 한자: `100~199`\n* 확장 한자: `200~`\n\n---\n\n### 2. 단어 데이터\n\n단어는 다음과 같이 저장됩니다.\n\n```json\n{\n  \"word\": \"전화\",\n  \"hanja\": \"電話\",\n  \"meaning_ko\": \"전화\",\n  \"meaning_en\": \"telephone\",\n  \"components\": [\"電\", \"話\"],\n  \"semantic_hint\": \"전기로 말함\"\n}\n```\n\n---\n\n### 3. 그래프 구조\n\n단어와 한자는 내부적으로 그래프로 연결됩니다.\n\n예시:\n\n```text\n文 ─ 文化\n │\n ├─ 文學\n │\n ├─ 文字\n │\n └─ 文法\n```\n\n또한:\n\n```text\n水 ─ 水道\n │\n ├─ 水泳\n │\n ├─ 海水\n │\n └─ 噴水\n```\n\n와 같이 확장됩니다.\n\n---\n\n## Program\n\n본 프로젝트는 데이터베이스를 구축하는 것에서 끝나지 않으며,\n그래프 기반 언어 학습 프로그램을 함께 개발하는 것을 목표로 합니다.\n\n---\n\n## 1. 프로그램 목적\n\n본 프로젝트의 프로그램은:\n\n* 한자 기반 한국어 학습 지원\n* 단어 구조 기반 의미 추론 훈련\n* 네트워크 그래프 시각화 기반 언어 학습\n* 미지 단어 분석 능력 향상\n\n을 목표로 합니다.\n\n학습자는 각 한자를 사전처럼 탐색할 수 있어야 하며:\n\n* 발음\n* 의미\n* 연결 단어\n* 예문\n* 연관 한자\n* 그래프 연결 구조\n\n를 시각적으로 확인할 수 있어야 합니다.\n\n---\n\n## 2. 핵심 학습 방식\n\n본 프로그램은 단순 암기형 학습이 아니라,\n\"구성 요소 기반 추론 훈련\"을 목표로 합니다.\n\n예를 들어:\n\n```text\n수학 시간에 분수를 배웠다.\n```\n\n라는 문장이 주어지면:\n\n```text\n分數 = 나눈 수\n噴水 = 물을 뿜음\n```\n\n중 어떤 의미인지 문맥 기반으로 선택하도록 학습합니다.\n\n---\n\n## 3. 그래프 기반 시각화\n\n프로그램은 내부 데이터를 네트워크 그래프로 시각화하는 기능을 목표로 합니다.\n\n예시:\n\n```text\n電 ─ 電話\n │\n ├─ 電氣\n │\n ├─ 電力\n │\n └─ 發電\n```\n\n사용자는 특정 한자를 중심으로:\n\n* 연결 강도\n* 사용 빈도\n* 의미 군집\n* 단어 거리\n\n등을 시각적으로 탐색할 수 있습니다.\n\n---\n\n## 4. 사용 언어 및 플랫폼\n\n사용 언어에 제한은 두지 않지만, 다음 목표를 우선합니다.\n\n### 4.1 성능\n\n1800개 이상의 한자와 수천 개 이상의 단어 네트워크를 처리해야 하므로:\n\n* 빠른 그래프 탐색\n* 병렬 처리\n* 대규모 시각화\n\n를 고려해야 합니다.\n\n---\n\n### 4.2 접근성\n\n다음 중 하나 이상을 목표로 합니다.\n\n* 웹 기반 서비스\n* 크로스 플랫폼 데스크탑 앱\n* 모바일 접근 지원\n\n언제 어디서나 학습 가능해야 합니다.\n\n---\n\n### 4.3 다국어 지원\n\n우선 지원 언어:\n\n* 한국어\n* 영어\n\n향후 지원 예정:\n\n* 러시아어\n* 중국어\n* 일본어\n\n---\n\n## 5. 장기 목표\n\n본 프로젝트는 단순한 학습 앱을 넘어:\n\n* 한국어 한자어 그래프 연구\n* 언어 네트워크 분석\n* 의미 기반 단어 추론 모델\n* 외국인 학습자 맞춤형 언어 지도\n* 한국어 의미 연결 시각화\n\n등으로 확장되는 것을 목표로 합니다.\n\n또한 장기적으로는:\n\n```text\n단어 → 한자 → 의미 → 문맥 → 추론\n```\n\n의 과정을 인간 학습자와 AI가 함께 활용할 수 있는 구조로 발전시키고자 합니다.\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Felecbug%2Fhan-graph","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Felecbug%2Fhan-graph","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Felecbug%2Fhan-graph/lists"}