https://github.com/timerke/simpletextanalyzer

Приложение на Си для простого анализа текстового файла
https://github.com/timerke/simpletextanalyzer

Last synced: about 1 year ago
JSON representation

Приложение на Си для простого анализа текстового файла

Host: GitHub
URL: https://github.com/timerke/simpletextanalyzer
Owner: timerke
Created: 2020-12-24T12:57:00.000Z (over 5 years ago)
Default Branch: main
Last Pushed: 2020-12-25T00:36:52.000Z (over 5 years ago)
Last Synced: 2025-02-08T11:43:06.664Z (over 1 year ago)
Topics: c
Language: C
Homepage:
Size: 54.7 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# SimpleTextAnalyzer
[![Build Status](https://travis-ci.com/timerke/SimpleTextAnalyzer.svg?branch=main)](https://travis-ci.com/timerke/SimpleTextAnalyzer)

Приложение на Си для простого анализа текстового файла
## Задание
Разработать программу анализа текстового файла. Программа должна считывать файл с текстом и проводить его частотный анализ. Результаты работы программы должны сохраняться в файл.
## Требования к тексту
Текст состоит из «слов» (только английские буквы и цифры), разделенных пробельными символами (пробел, знак табуляции и знак переноса на новую строку) и(или) знаками пунктуации (запятая, точка, тире, кавыка и прочее). Слова не переносятся. Апостроф не учитывать (считать как два отдельных слова: don't = don + t).
## Требования к реализации
### Общие сведения о тексте (обязательная часть)
Программа должна подсчитывать общее число абзацев, количество предложений и количество слов в тексте, среднее количество слов в предложении.
### Подсчет частоты символов
Программа должна подсчитывать частоту каждого символа (включая пробелы и разделители) в тексте.
### Подсчет частоты слов
Программа должна считывать текст и дробить его на «слова» (непрерывная последовательность букв и(или) цифр). Формировать из полученного набора слов словарь, содержащий только уникальные слова (дублирований слов в словаре быть не должно). Словарь должен содержать информацию о частоте встречаемости слова (Частота слова = Количество повторений слова в тексте / Общее число слов).
## Аргументы командной строки
Приложение принимает параметры из командной строки:

app -i file_in -o file_out

Здесь
* `file_in` - путь к файлу с текстом, который нужно проанализировать;
* `file_out` - путь к файлу, в который нужно записать результаты анализа.

Если приложению не передан путь `file_out`, то результаты выводятся на экран.
Результаты анализа подвергаются быстрой сортировке.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/timerke/simpletextanalyzer

Awesome Lists containing this project

README