Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/ppke-nlpg/AnaGramma-Parser
Egy pszicholingvisztikai indíttatású elemző modell
https://github.com/ppke-nlpg/AnaGramma-Parser
Last synced: 2 months ago
JSON representation
Egy pszicholingvisztikai indíttatású elemző modell
- Host: GitHub
- URL: https://github.com/ppke-nlpg/AnaGramma-Parser
- Owner: ppke-nlpg
- License: lgpl-3.0
- Created: 2014-01-15T15:36:41.000Z (over 10 years ago)
- Default Branch: master
- Last Pushed: 2018-11-12T11:38:00.000Z (over 5 years ago)
- Last Synced: 2024-03-26T05:15:24.413Z (3 months ago)
- Language: Python
- Size: 24.9 MB
- Stars: 1
- Watchers: 8
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Lists
- awesome-hungarian-nlp - Anagramma Parser
README
AnaGramma-Parser
================Egy pszicholingvisztikai indíttatású elemző modell
Részben vagy egészben történő felhasználás esetén az alábbi cikket
kell meghivatkozni:
Prószéky Gábor, Indig Balázs, Miháltz Márton, Sass Bálint:
"Egy pszicholingvisztikai indíttatású számítógépes nyelvfeldolgozási modell felé"
X. Magyar Számítógépes Nyelvészeti Konferencia MSzNy. 2014. január 16-17 (2014).### Függőségek:
- Python 3.5 (*Nix alapú rendszeren, preferáltan Linux)
- NLTK 3.0
- [PurePOSPy](https://github.com/ppke-nlpg/purepospy) (a megfelelő verzió szükséges)
- Humor morfológiai elemző REST API-n keresztüli eléréssel hasonlóan az [emMorpPy](https://github.com/ppke-nlpg/emmorphpy)-hez.### Használata:
1. Két helyen a kódban meg kell adni a megfelelő elérésiutakat a PurePOS és a Humor REST API-hoz (ling_rules/morphology_converter/morphologyConverter.py:231 és engine/windowedMorphology.py:102)
2. ./test.sh futtatásával a példamondatokon lefut a teszt a forráskódban definiált mondatokon.### Nyelvi szabályok:
A rendszer négy egymással konzisztens lépésre épül:
1. A töbtagúnév esetek feldolgozása a szófaji egyértelműsítés után: ling_rules/mosaic.py
2. Morfológia: Humor kód -> Elemző jellemzők konvertálása: ling_rules/morphology_converter/morphologyConverter.py
3. Minták feldolgozása: Az egyes tokenek jellemzői definiálják a teendőiket (pl. __dinamikus jellemzők__, __keresletek__), amiket egy külön lépésben végrehajt a program: ling_rules/patternsAndActions.py
4. A definiált __keresők__ implementációi: A program futása során ezek a programrészletek futna le a __keresők__ működése közben: ling_rules/mainActions.py
5. (+1) Az igekötők és vonzatkeretek szótára külön fájlban kapott helyet: ling_rules/verbDictionary.py### Kapcsolódó modulok:
- [Manócska](https://github.com/ppke-nlpg/manocska): Integrált igei vonzatkerettár, mely az elemző vonzatkeret-szótáraként használható
- [VFrame](https://github.com/ppke-nlpg/vframe): Az igék vonztatkeret-lehetőségeinek leszűkítésére használt eljárás, beépítésre került az elemzőbe
- [Nom-or-What](https://github.com/ppke-nlpg/nom-or-what): A morfológiai "nominatívusz" egyértelműsítésére szolgáló eljárás, beépítésre került az elemzőbe
- [Whats wrong, Python?](https://github.com/ppke-nlpg/whats-wrong-python): Nyelvtechnológiai programok kimenetének és a kimenetek különbségeinek vizualizációjára is használható könyvtár (béta állapotú), felhasználható mint az elemző vizuális kimenete
- [EmMorphPy](https://github.com/ppke-nlpg/emmorphpy): A Humor morfológiai elemzőhöz is használt REST API azóta továbbfejlesztett változata, az elemzőben a Humor REST API-ját szolgáltatja
- [PurePOS](https://github.com/ppke-nlpg/purepos): Szófaji egyértelműsítő, az elemzőben ideiglenesen került felhasználásra
- [PurePOSPy](https://github.com/ppke-nlpg/purepospy): Python wrapper és REST API a PurePOS-hoz, az elemzőben ideiglenesen került felhasználásraTechnikai kérdésekkel kapcsolatban Indig Balázst (indig.balazs@itk) lehet keresni.