https://github.com/timerke/simpletextanalyzer
Приложение на Си для простого анализа текстового файла
https://github.com/timerke/simpletextanalyzer
c
Last synced: about 1 year ago
JSON representation
Приложение на Си для простого анализа текстового файла
- Host: GitHub
- URL: https://github.com/timerke/simpletextanalyzer
- Owner: timerke
- Created: 2020-12-24T12:57:00.000Z (over 5 years ago)
- Default Branch: main
- Last Pushed: 2020-12-25T00:36:52.000Z (over 5 years ago)
- Last Synced: 2025-02-08T11:43:06.664Z (over 1 year ago)
- Topics: c
- Language: C
- Homepage:
- Size: 54.7 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# SimpleTextAnalyzer
[](https://travis-ci.com/timerke/SimpleTextAnalyzer)
Приложение на Си для простого анализа текстового файла
## Задание
Разработать программу анализа текстового файла. Программа должна считывать файл с текстом и проводить его частотный анализ. Результаты работы программы должны сохраняться в файл.
## Требования к тексту
Текст состоит из «слов» (только английские буквы и цифры), разделенных пробельными символами (пробел, знак табуляции и знак переноса на новую строку) и(или) знаками пунктуации (запятая, точка, тире, кавыка и прочее). Слова не переносятся. Апостроф не учитывать (считать как два отдельных слова: don't = don + t).
## Требования к реализации
### Общие сведения о тексте (обязательная часть)
Программа должна подсчитывать общее число абзацев, количество предложений и количество слов в тексте, среднее количество слов в предложении.
### Подсчет частоты символов
Программа должна подсчитывать частоту каждого символа (включая пробелы и разделители) в тексте.
### Подсчет частоты слов
Программа должна считывать текст и дробить его на «слова» (непрерывная последовательность букв и(или) цифр). Формировать из полученного набора слов словарь, содержащий только уникальные слова (дублирований слов в словаре быть не должно). Словарь должен содержать информацию о частоте встречаемости слова (Частота слова = Количество повторений слова в тексте / Общее число слов).
## Аргументы командной строки
Приложение принимает параметры из командной строки:
app -i file_in -o file_out
Здесь
* `file_in` - путь к файлу с текстом, который нужно проанализировать;
* `file_out` - путь к файлу, в который нужно записать результаты анализа.
Если приложению не передан путь `file_out`, то результаты выводятся на экран.
Результаты анализа подвергаются быстрой сортировке.