{"id":17914229,"url":"https://github.com/knadh/datuk","last_synced_at":"2025-04-03T07:25:56.088Z","repository":{"id":5655110,"uuid":"6864181","full_name":"knadh/datuk","owner":"knadh","description":"\"Datuk\", the Unicode Malayalam - Malayalam dictionary dataset","archived":false,"fork":false,"pushed_at":"2019-12-18T06:27:05.000Z","size":11443,"stargazers_count":43,"open_issues_count":0,"forks_count":10,"subscribers_count":10,"default_branch":"master","last_synced_at":"2025-02-08T21:14:48.263Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":null,"language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"odbl-1.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/knadh.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2012-11-26T11:33:49.000Z","updated_at":"2024-12-04T09:01:56.000Z","dependencies_parsed_at":"2022-09-09T20:30:32.381Z","dependency_job_id":null,"html_url":"https://github.com/knadh/datuk","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/knadh%2Fdatuk","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/knadh%2Fdatuk/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/knadh%2Fdatuk/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/knadh%2Fdatuk/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/knadh","download_url":"https://codeload.github.com/knadh/datuk/tar.gz/refs/heads/master","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":246954583,"owners_count":20860171,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2024-10-28T19:56:57.372Z","updated_at":"2025-04-03T07:25:56.070Z","avatar_url":"https://github.com/knadh.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# The Datuk Corpus\n The [Datuk](https://olam.in/open/datuk/) corpus is a free and open source Malayalam–Malayalam dictionary dataset with over 106,000 \n definitions for more than 83,000 Malayalam words. It is an extensively refined and semanticized \n version of Datuk's original ASCII digitisation work, and incorporates tens of thousands of changes and corrections. \n The majority of words and definitions are grammar tagged, and a large number of records \n also have additional metadata attached to them.\n\n## Usage\nThe corpus is available as a searchable dictionary on https://olam.in\n\n## Format\nThe corpus is a single YAML file, datuk.yaml, that is a single array of every single entry. Each entry is in the following format.\n\n```yaml\n- id: '55127'     # Orignal ID of the entry\n  head: പ        # Alphabet / letter of the entry word.\n  entry: പകിടി    # Entry Word.\n  origin: ''      # Tag denoting the origin.\n  info: ''        # Additional (optional) info.\n  defs:           # Array of definitions.\n  - entry: ഉപായം  # Definition.\n    type: നാ.      # Type\n  - entry: വഞ്ചന\n    type: നാ.\n  - entry: നേരമ്പോക്ക്\n    type: നാ.\n  - entry: താടി\n    type: നാ.\n  - entry: കൈമടക്ക്, കെട്ടിടം വാടകയ്ക്കുകൊടുക്കുമ്പോള്‍ ഉടമസ്ഥനു രേഖയില്ലാതെ മുന്‍കൂര്‍കൊടുക്കുന്ന\n      തുക\n    type: നാ.\n  - entry: വലിയ തലപ്പാവ്. (പ്ര.) പകിടിക്കഥ = ചിരിപ്പിക്കാനുള്ള കഥ\n    type: നാ.\n```\n\nTo add new entries, a YAML block like the one shown above can be appended to the corpus file.\n\n# Types.\nThese are the abbreviated types from the original corpus. When adding new words, the appropriate ones may be used.\n\n| നാ.                                    |\n|----------------------------------------|\n| ക്രി.                                   |\n| വി.                                    |\n| നാ. പു.ബ.വ.                             |\n| നാ. ബ.വ.                               |\n| വിഭ. അവ്യ.                              |\n| അവ്യ.                                   |\n| ഭൂ.പേ. വി.                              |\n| നാ. സംഗീ.                              |\n| നാ. വ്യാക.                              |\n| നാ. വി.                                |\n| വ്യാക.                                  |\n| ആല.                                    |\n| ജൈന.                                   |\n| ബുദ്ധ.                                   |\n| വ്യാ.                                   |\n| നാ. ഗണിത.                              |\n| നാ. ബുദ്ധ.                               |\n| നാ. ജ്യോ.                              |\n| തന്ത്ര.                                  |\n| നാട്യ.                                  |\n| പു.                                     |\n| നപും.                                   |\n| യോഗ.                                  |\n| നാ. തച്ചു.                               |\n| നാ. ആയുര്‍.                               |\n| നാ. ഭാ.ശാ.                             |\n| നാ. ജൈന.                               |\n| പഴ.                                    |\n| സ.നാ.                                  |\n| പ്ര.                                    |\n| തച്ചു.                                   |\n| സംഗീ.                                  |\n| നാ. നാട്യ.                              |\n| ധാതുരൂപം.                                |\n| അവ്യ. മുന്‍വിന.                            |\n| ഭൂ.പേ. പ്ര.                              |\n| നാ. രാഷ്ട്ര.                             |\n| ഉപ.                                    |\n| ഇ.                                     |\n| ബ.വ.                                   |\n| ജ്യോ.                                  |\n| വൈദ്യ.                                  |\n| നാ. അലം.                               |\n| വി. ഗണിത.                              |\n| നാ. രസ.                                |\n| വേദാന്ത.                                |\n| ക്രി. വ്യാക.                             |\n| നിയമ.                                  |\n| വ.                                     |\n| നാ. സാംഖ്യ.                             |\n| ആയുര്‍.                                   |\n| ഗണിത.                                  |\n| തര്‍ക്ക.                                  |\n| നാ. തര്‍ക്ക.                              |\n| അലം.                                   |\n| നാ. നാസ്യ.                              |\n| മുന്‍വിന.                                 |\n| നാ. ഹഠ.                                |\n| നാ. ബ.വ. യോഗ.                         |\n| നാ. ന്യായ.                              |\n| നാ. മന.                                |\n| വൈശേ.                                  |\n| മീമാ.                                  |\n| നാ. വൈശേ.                              |\n| സാംഖ്യ.                                 |\n| നാ. നിയമ.                              |\n| നാ. പുരാണ.                              |\n| രാഷ്ട്ര.                                 |\n| നാ. കാവ്യ.                              |\n| നാ. വേദാന്ത.                            |\n| പുരാണ.                                  |\n| നാ. യോഗ.                              |\n| താരത.                                  |\n| ഭൂ.പേ.                                  |\n| നാ. നാട്യ. ബ.വ.                         |\n| നാ. ബ.വ. വ്യാക.                         |\n| ഭൂ.                                     |\n| പ.മ.                                   |\n| നാ. ക്രിസ്തു.                             |\n| ക്രി. ആചാര.                             |\n| വി. ഭൂ.പേ.                              |\n| കാവ്യ.                                  |\n| സ.നാ. പ്ര. പു. സ്‌ത്രീ., ഏ.വ.               |\n| നാ. ബീജഗണിത.                           |\n| നാ. ബ.വ. നാട്യ.                         |\n| വി. ന്യായ.                              |\n| പ്ര. പു. ഏ.വ. ക്രി.                       |\n| നാ. അവ്യ.                               |\n| വിന.                                   |\n| അനുജ്ഞാ. പ്ര. വ്യാക.                       |\n| പേരെച്ചം. വി.                           |\n| പ്രാ. വിന. അവ്യ.                         |\n| ക്രി. മുന്‍വിന.                            |\n| ഭൂ.കാ. ക്രി.                             |\n| വൃത്ത.                                   |\n| നാ. വൃത്ത.                               |\n| നാ. പ്ര.                                |\n| ഭൂ.പേ. ക്രി. വ്യാക.                       |\n| ശില്‍പ.                                  |\n| നാ. തന്ത്ര.                              |\n| നാ. ദ്വിവ.                              |\n| സ.നാ. പു.ബ.വ.                           |\n| ക്രിസ്തു.                                 |\n| നാ. ബ.വ. ക്രിസ്തു.                        |\n| സ.നാ. പ്ര. പു., ഏ.വ., നപും.               |\n| സ്‌ത്രീ. ഇന്നവള്‍. ബ.വ.                      |\n| വര്‍ത്സ്യനകാരം അവ്യ.                        |\n| വര്‍ത്സ്യനകാരം സ.നാ.                       |\n| സ.നാ., ഉ. പു., ബ.വ.                     |\n| സ.നാ. ബ.വ.                             |\n| [പ.മ.]                                 |\n| പേരെച്ചപ്രത്യയം വി.                       |\n| ഭൂ.രൂ. ക്രി.                              |\n| ഭാ.ശാ.                                 |\n| പ.മ. നാ.                               |\n| നാ. പ.മ.                               |\n| പിന്‍വിന.                                |\n| ആ.ഭാ.                                  |\n| പ.മ. സംവൃതോകാരാന്തം സ.നാ.               |\n| നാ. കാമ.                               |\n| നാ. മുസ്ലിം.                             |\n| ഏ.വ.                                   |\n| ഖി.                                    |\n| മു.വി.                                  |\n| ക്രി. ബ.വ.                              |\n| ഭൂ.പേ.വി.                               |\n| ഭൂ.രൂ.                                   |\n| അവ്യ. ഭൂ.പേ.                             |\n| ക്രി. ഭൂ.കാ..                            |\n| ക്രി. പ.മ.                              |\n| നാ. പു.                                 |\n| നാ. ഉ.പു. ബ.വ.                          |\n| നാ. ഉ.പു.ബ.വ.                           |\n| അവ്യ. ചോദ്യ. പ.മ.                       |\n| അവ്യ. പ.മ.                              |\n| ബഹ്വര്‍ഥത്തില്‍ ദ്വിത്വം.                      |\n| ചോദ്യ. സ.നാ.                           |\n| ഭൂ. പ്രാ. വിന.                           |\n| ക്രി. ഭൂ.രൂ.                              |\n| ആ. നാ.                                 |\n| പി. വി.                                |\n| വി. വ.പേ.                              |\n| അവ്യ. തന്‍വിന.                            |\n| ത. വി.                                 |\n| ആ. ഭാ. പ്ര.                             |\n| നാ. പ്ര.പു. ബ.വ.                         |\n| സ.നാ. ഉ. പു. ഏ.വ.                       |\n| അലിംഗ ബ.വ. സ.നാ.                       |\n| ജ്യോ.                                   |\n| നാ. ജ്യോ.                               |\n| അവ്യ. നടുവിന.                            |\n| വി. മുന്‍വിന.                             |\n| സംഖ്യാനാമം.                             |\n| അവ്യ. പ്രാ. വിന.                         |\n| \"ഏ\" ചേര്‍ന്ന് ഒന്നുമേ എന്നും രൂപം.              |\n| നിഷേധാഖ്യാതം.                           |\n| അവ്യ. വ്യാക.                             |\n| ക്രി. ഭൂ.                                |\n| നാ. വൈദ്യ.                              |\n| നാ. ശില്‍പ.                              |\n| പ. മ നാ. ബ.വ.                          |\n| സ.നാ. പ്ര.                              |\n| നാ. ശബ്ദാനു.                             |\n| ക്രി.വ.                                 |\n| \"കം ദാനം ചെയ്യുന്നത്\"                      |\n| ക്രി. പിന്‍വിന.                           |\n| താരത. സം.                              |\n| സ്‌ത്രീ.                                  |\n| ഏകവചനം. അവ്യ.                           |\n| വി. ഭൂ.കാ. പേരെച്ചം.                     |\n| അവ്യ. ശബ്ദാനു.                            |\n| നാ. ഇസ്ലാം.                             |\n| വിധിരൂപം.                               |\n| മുസ്ലിം.                                 |\n| നാ. ആ.ഭാ.                              |\n| ക്രി. ശബ്ദാനു.                            |\n| നാ. ആല.                                |\n| ക്രി. നടുവിന.                            |\n| ക്രി. പ്ര.                               |\n| കീ.                                    |\n| പ.മ അവ്യ.                               |\n| മുന്‍വിന. പ.മ                             |\n| കോതുക                                  |\n| നാ. ധന.                                |\n| വി. നിയമ.                              |\n| സമാ.                                   |\n| വി. സമാ.                               |\n| നാ. ബ.വ. ജ്യോ.                         |\n| കാമ.                                   |\n| പ. മ                                   |\n| താരത. നാ.                              |\n| വി.നാ.                                 |\n| നാ. ഊര്‍ജ.                               |\n| വി. ശബ്ദാനു.                             |\n| ശബ്ദാനു.                                 |\n| ബാ.                                    |\n| ക്രി. ഗണിത.                             |\n| \"ചുറ്റും കൂടുന്നവര്‍\"                          |\n| നാമരൂപം. പ്ര.                            |\n| ക്രി. ഗമ് ധാതു, ലിട് പ്ര.പു. ഏ.വ.            |\n| ക്രി. ഗാഹ് ധാതു, ലിട് പ്ര. പു. ഏ.വ. ആത്മനേപദി |\n| ഇസ്ലാം.                                 |\n| ജി ധാതു, ലോട് മ. പൂ. ഏ.വ. പരസ്മൈപദി       |\n| ജി ധാതു ലോട് പ്ര. പൂ. ഏ.വ. പരസ്മൈപദി       |\n| നാ. ഭൂമിശാ.                             |\n| ക്രി. ആയുര്‍.                              |\n| ഉ. പു. സ.നാ.                            |\n| ഉ.പു. സ.നാ. ഏ.വ. ഉഭയലിങ്ങം               |\n| ഹി.                                    |\n| സം.                                    |\n| നാ. ജീവശാ.                             |\n| മു.വി. പ്ര.                              |\n| നാ. പിന്‍വിന.                            |\n| നാ. തദ് ശബ്ദം സ്‌ത്രീ പ്രഥമ ദ്വിതീയ ദ്വി.വ.    |\n| ഗതി.                                   |\n| ക്രി. ത്യജ് ധാതു, ലോട് മ.പു. ഏ.വ.           |\n| നാ. (ബ.വ.) പുരാണ.                       |\n| വിഭക്തി.                                |\n| നാ. പുരാണ. ബ.വ.                         |\n| നി.ക്രി.                                |\n| നാ. ബ.വ. പുരാണ.                         |\n| പദാന്ത്യ.                                |\n| വി. പദാന്ത്യ.                            |\n| ക്രി. ഭൂ. ധാതു, ലോട് പരസ്മൈപദി പ്ര പൂ. ഏ.വ.  |\n| ക്രി. ഭൂ. ധാതു, ലോട് പരസ്മൈപദി പ്ര. പു. ഏ.വ. |\n| നാ. ദ്വി.വ.                             |\n| നാ. പദാന്ത്യ.                            |\n| അ. ദ്യോ.                               |\n| നാ. ദ്വി.വ. പുരാണ.                       |\n| നാ. ബ.വ. സം. ദ്വി.വ.                    |\n| ക്രി. ആ.ഭാ.                             |\n| രസ.                                    |\n| ഭൂ.രൂ. പ്ര.                               |\n| ഗതി. പദാന്ത്യ.                           |\n| നാ. വാസ്തു.                              |\n| ക്രി. വ്യാക. നിയോജകപ്രകാരം.              |\n| വി. നി.ക്രി.                            |\n| വാ.                                    |\n| അവ്യ. പദാന്ത്യ.                           |\n| നാ. ഭൂ.പേ.                              |\n| നിപാ.                                  |\n| വി. വ്യാക.                              |\n| നാ. ബ.വ. ആയുര്‍.                          |\n\n## License\nODbL\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fknadh%2Fdatuk","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fknadh%2Fdatuk","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fknadh%2Fdatuk/lists"}