https://github.com/disk0dancer/rubert-finetuned-pos
Course work 3rd year
https://github.com/disk0dancer/rubert-finetuned-pos
Last synced: 9 months ago
JSON representation
Course work 3rd year
- Host: GitHub
- URL: https://github.com/disk0dancer/rubert-finetuned-pos
- Owner: disk0Dancer
- License: mit
- Created: 2024-03-24T04:02:18.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2024-11-17T10:37:37.000Z (over 1 year ago)
- Last Synced: 2025-02-10T16:57:34.107Z (over 1 year ago)
- Language: Jupyter Notebook
- Size: 3.94 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Репозитория с кодом и документацией к курсовой работе 3 курс
**Аннотация**: модель разработана для предобработки текстов, в задаче машинного перевода, с целью изменения порядка слов в последовательности, чтобы улучшить качество перевода.
**Тема**: Разработка модели для определения скелетной структуры текста, представленного на русском или английском языке
**Автор**: Чураков Григорий Александрович
**Руководитель**: Мыльников Леонид Александрович
**Ключевые слова**: частеречная разметка, морфологический анализ словоформ, обработка естественного языка.
## Информация о директориях
- `./data-preparation` - в директории расположены дотасет, исходники, код предобработки
- `./docs` - директория содержит документацию к курсовой работе
- `./gradio-app` - директори Содержит код десонстрационного приложения для взаимодействия с моделью
- `./model-finetuning` - директори содержит код моделі, а также Процесса обучения
# Repository with code and documentation for coursework 3rd year
**Annotation:** The model is designed for text preprocessing, in a machine translation problem, with the aim of changing the order of words in a sequence to improve the quality of translation.
**Topic:** Development of a model for determining the skeletal structure of text presented in Russian or English
**Author:** Churakov Grigory Alexandrovich
**Head:** Leonid Aleksandrovich Mylnikov
**Keywords:** part of speech tagging, morphological analysis of word forms, natural language processing.
## Content Information
- `./data-preparation` - dataset, sources, preprocessing code are located in the directory
- `./docs - directory` contains documentation for coursework
- `./gradio-app` - director Contains the code of the demonstation application for interacting with the model
- `./model-finetuning` - the director contains the code of the modelі, as well as the Training Process
## Citation
```
@misc{churakov2024postagginghighlightskeletalstructure,
title={POS-tagging to highlight the skeletal structure of sentences},
author={Grigorii Churakov},
year={2024},
eprint={2411.14393},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2411.14393}
}
```