https://github.com/sevelev-ens/belarusian2latin
Belarusian Cyrillic to Latin converter
https://github.com/sevelev-ens/belarusian2latin
Last synced: about 2 months ago
JSON representation
Belarusian Cyrillic to Latin converter
- Host: GitHub
- URL: https://github.com/sevelev-ens/belarusian2latin
- Owner: sevelev-ens
- Created: 2019-08-02T14:06:30.000Z (almost 6 years ago)
- Default Branch: master
- Last Pushed: 2022-09-04T08:48:26.000Z (almost 3 years ago)
- Last Synced: 2025-02-01T09:03:03.028Z (5 months ago)
- Language: Python
- Size: 25.4 KB
- Stars: 6
- Watchers: 2
- Forks: 3
- Open Issues: 3
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# belarusian2latin
*Беларуская версія ніжэй*
First, to our knowledge, Belarusian Cyrillic to Latin converter that
- systematically cares to render Belarusian phonology correctly. It concerns, e.g.,
- the regressive palatalization issue (i.e. /sjnjɛɣ/ is rendered “śnieh“ and not “snieh”). Overpalatalized dentals constituting a characteristic feature of Belarusan (so-called “dziekańnie”, “ciekańnie”), it is primordial to render them correctly **systematically**;
- the laxist graphic convention of the official Cyrillic system as to the letter «г»: may denote /ɣ(j)/ or /g(j)/ with no evident pattern: “гісторыя”/“гузік”);
- the laxist graphic convention of the official Cyrillic system as to the letter «і»: may denote /і/ or /jі/ (diphtong) with no evident pattern trigerring two different palatalization patterns: “ім”/“інтэгральны” → “з ім”/“з інтэгральнага” /і→ы/ /jі→(j)i/;
- the laxist graphic convention of the official Cyrillic system as to the letter «e»: in borrowed words, it may confer or not palatalization to the previous consonant with no evident pattern: “веласіпед”/“Аве Марыя” /v/ and /v(j)/;
- complies with the official Belarus's [prescription](https://be.wikipedia.org/wiki/%D0%86%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%86%D1%8B%D1%8F_%D0%BF%D0%B0_%D1%82%D1%80%D0%B0%D0%BD%D1%81%D0%BB%D1%96%D1%82%D0%B0%D1%80%D0%B0%D1%86%D1%8B%D1%96) to use the alphabet «abcćčdefhijklĺmnńoprsśštuŭvyzžź» and the [UN standard](https://unstats.un.org/unsd/geoinfo/UNGEGN/docs/9th-uncsgn-docs/crp/9th_UNCSGN_e-conf-98-crp-21.pdf) based thereupon;
- complies with the [official Belarus's Orthographic rules](https://be.wikipedia.org/wiki/%D0%9F%D1%80%D0%B0%D0%B2%D1%96%D0%BB%D1%8B_%D0%B1%D0%B5%D0%BB%D0%B0%D1%80%D1%83%D1%81%D0%BA%D0%B0%D0%B9_%D0%B0%D1%80%D1%84%D0%B0%D0%B3%D1%80%D0%B0%D1%84%D1%96%D1%96_%D1%96_%D0%BF%D1%83%D0%BD%D0%BA%D1%82%D1%83%D0%B0%D1%86%D1%8B%D1%96_(2008)).We thoroughly follow the Belarusian phonology description as given at:
> Фанетыка беларускай літатурнай мовы / І. Р. Булыка, Л. Ц. Выгонная, Г. В. Лосік, А. І. Падлужны; Рэд. А. І. Падлужны. — Мн.:Навука і тэхніка, 1989. — 335 с ISBN 5-343-00292-7
We are aware of the following toy converters: [Sloŭnik.org](http://slounik.org/lat), [Baltoslav](http://baltoslav.eu/lat/), [Draŭliany Zedlik](http://www.zedlik.com/pragramy/kir2lac-online/), [Dobrapis](http://dobrapis.belsat.eu/convert.html). As of Aug 02, 2019, all of them fail to render correctly the phonemes (try: “снег, здзяйсняецца” (not) to obtain “śnieh, ździajśniajecca”).
The transcription generator by the [Speech Analysis and Recognition Lab](https://www.corpus.by/TranscriptionGenerator/?lang=be) of the Belarusan Academy of Sciences only deals with tagged text and produces phonetic [···], not phonematic /···/ transcriptions. The transliteration generator [Philology.by](https://tools.philology.by/latbe) by [Alyaxey Yaskevich](https://yaskevich.com/) pursues another objective as well.
## On-line demo
[Belarusian Cyrillic to Latin converter](https://seveleu.com/lacinka/converter)## Examples of valid texts
Numerous examples of valid Belarusian Latin texts: [Lacinka — Teksty](https://lacinka.teksty.seveleu.com/)
# Беларускае апісанне
Першы з вядомых нам канвертар беларускай кірылічнай графікі ў лацінскую, што адпавядае наступным патрабаванням:
- надае абсалютны прымат правільнасці паслядоўнага перадання беларускіх фанетычных з'яў. Перш за ўсё гэта датычыцца:
- рэгрэсіўнай палаталізацыі (памякчэння), напрыклад, слова /sjnjɛɣ/ павінна перадавацца «śnieh», а не «snieh». Звышпамякчэнне зубных (т.звзв. «дзеканне», «цеканне») — адметная рыса беларускай мовы, архіважна паслядоўна і **сістэматычна** адлюстроўваць гэтую асаблівасць на пісьме.
- патуральніцкага (лаксісцкага) дачынення афіцыйнай кірылічнай графікі да літары «г»: яна можа абазначаць фанемы /ɣ(j)/ ці /g(j)/ без ніякага дадатковага размежавання: “гісторыя”/“гузік”);
- патуральніцкага (лаксісцкага) дачынення афіцыйнай кірылічнай графікі да літары «і»: яна можа абазначаць фанему /і/ ці дыфтонг /jі/ без ніякага дадатковага размежавання. Дзве гэтыя розныя фанемы па-рознаму задзейнічаюць механізм палаталізацыі (памякчэння): “ім”/“інтэгральны” → “з ім”/“з інтэгральнага” /і→ы/ /jі→(j)i/;
- патуральніцкага (лаксісцкага) дачынення афіцыйнай кірылічнай графікі да літары «е»: у запазычаных словах яна можа абазначаць прысутнасць ці адсутнасць палаталізацыі (памякчэння) папярэдняга зычнага без ніякага дадатковага размежавання: “веласіпед”/“Аве Марыя” /v/ і /v(j)/;
- адпавядае афіцыяльнай дзяржаўнай [Інструкцыі](https://be.wikipedia.org/wiki/%D0%86%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%86%D1%8B%D1%8F_%D0%BF%D0%B0_%D1%82%D1%80%D0%B0%D0%BD%D1%81%D0%BB%D1%96%D1%82%D0%B0%D1%80%D0%B0%D1%86%D1%8B%D1%96) выкарыстоўваць азбуку «abcćčdefhijklĺmnńoprsśštuŭvyzžź» і [стандарту ААН](https://unstats.un.org/unsd/geoinfo/UNGEGN/docs/9th-uncsgn-docs/crp/9th_UNCSGN_e-conf-98-crp-21.pdf), заснованным на ёй;
- адпавядае [афіцыяльным Правілам беларускай арфаграфіі і пунктуацыі](https://be.wikipedia.org/wiki/%D0%9F%D1%80%D0%B0%D0%B2%D1%96%D0%BB%D1%8B_%D0%B1%D0%B5%D0%BB%D0%B0%D1%80%D1%83%D1%81%D0%BA%D0%B0%D0%B9_%D0%B0%D1%80%D1%84%D0%B0%D0%B3%D1%80%D0%B0%D1%84%D1%96%D1%96_%D1%96_%D0%BF%D1%83%D0%BD%D0%BA%D1%82%D1%83%D0%B0%D1%86%D1%8B%D1%96_(2008)).Пры абмеркаванні беларускай фанетыкі мы перш за ўсё кіруемся яе кадыфікаваным апісаннем у наступным выданні:
> Фанетыка беларускай літатурнай мовы / І. Р. Булыка, Л. Ц. Выгонная, Г. В. Лосік, А. І. Падлужны; Рэд. А. І. Падлужны. — Мн.:Навука і тэхніка, 1989. — 335 с ISBN 5-343-00292-7
Нам вядомыя наступныя праекты канвертараў: [Слоўнік.орг](http://slounik.org/lat), [БалтаСлаў](http://baltoslav.eu/lat/), [Драўляны Зэдлік](http://www.zedlik.com/pragramy/kir2lac-online/), [Добрапіс](http://dobrapis.belsat.eu/convert.html). На жаль, яны не маюць плёну. Па стане на 2 жніўня 2019, кожны з іх выдаваў няслушны рэзультат у дачыненні ўжо першага пункта згаданага вышэй спісу — правільнага перадавання фанем: увод “снег, здзяйсняецца” не выдае “śnieh, ździajśniajecca”.
Генератар транскрыпцый [Лабараторыі распазнавання і сінтэзу маўлення](https://www.corpus.by/TranscriptionGenerator/?lang=be) Акадэміі Навук Беларусі прымае толькі размечаны тэкст і на выхадзе дае фанетычную [···], а не фанематычную /···/ транскрыпцыю. Генератар транслітэрацый [Philology.by](https://tools.philology.by/latbe), выкананы [Аляксеям Яскевічам](https://yaskevich.com/) таксама ставіць сабе іншую праграму на мэту.
## Анлайн прататып
[Belarusian Cyrillic to Latin converter](https://seveleu.com/lacinka/converter)## Прыклады правадзейных тэкстаў
Шматлікія прыклады правадзейных (валідных, англ. valid) беларускіх тэкстаў лацінкай: [Lacinka — Teksty](https://lacinka.teksty.seveleu.com/)