https://github.com/vmussa/sdbase
Scripts Básicos para Sociologia Digital
https://github.com/vmussa/sdbase
computational-social-science computational-sociology digital-humanities digital-sociology qualitative-analysis qualitative-data-analysis qualitative-research web-scraper
Last synced: about 1 month ago
JSON representation
Scripts Básicos para Sociologia Digital
- Host: GitHub
- URL: https://github.com/vmussa/sdbase
- Owner: vmussa
- Created: 2020-11-20T01:10:08.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2021-02-19T15:01:08.000Z (about 4 years ago)
- Last Synced: 2025-03-24T12:12:28.963Z (about 2 months ago)
- Topics: computational-social-science, computational-sociology, digital-humanities, digital-sociology, qualitative-analysis, qualitative-data-analysis, qualitative-research, web-scraper
- Language: Python
- Homepage:
- Size: 17.6 KB
- Stars: 9
- Watchers: 2
- Forks: 0
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Scripts Básicos para Sociologia Digital (sdbase)
Esse repositório guarda uma série de scripts básicos para o auxílio à pesquisa em Sociologia Digital. O objetivo dessa iniciativa é facilitar o acesso às técnicas computacionais a pesquisadores não familiarizados com essas técnicas, a iniciantes, assim como a usuários avançados que queiram construir técnicas mais complexas em cima das mais básicas aqui disponíveis. O foco do `sdbase` é o auxílio computacional à pesquisa qualitativa, mineração de texto para as humanidades e áreas relacionadas.## Raspador do Reddit para a Análise Qualitativa e Codificação: `rdqda`
O `rdqda` é um módulo e script pythônico para a formatação e exportação de dados da rede social Reddit próprio para a análise qualitativa e a codificação. O formato de saída dos dados privilegia, portanto, a fidelidade à forma como os dados são exibidos na rede social, aproximando a prática da codificação à experiência da plataforma no browser. Recomendamos ao usuário que clone o repositório para usá-lo, tal como explicado abaixo, na seção de instalação. Para usuários mais avançados, basta adicionar o módulo ao `PYTHONPATH` e importá-lo em seu código.## Estruturação de dados textuais de conversas do WhatsApp
Por enquanto, o módulo e script do WhatsApp oferece apenas a conversão para `csv` de dados de conversas em `txt` exportados diretamente pelo aplicativo. Veja abaixo instruções para o modo de uso.## Requisitos para a instalação
* Python 3.8
* pandas (biblioteca para manipulação de dados via DataFrames)
* PRAW (biblioteca que facilita o acesso à API do Reddit)O arquivo `requirements.txt` contém todas essas informações, o que permite uma instalação fácil, como indicado na seção abaixo.
## Instalação e modo de uso
Basta clonar o repositório, criar um ambiente virtual, instalar as bibliotecas indicadas acima com o `pip` e rodar os scripts com o Python, como no exemplo abaixo:
```
cd diretorio-de-instalacao
git clone https://github.com/vmussa/sdbase.git
cd sdbase
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
```
Para o usar módulo do Reddit:
```
python reddit\submissions_para_txt.py
```
Para o usar módulo do WhatsApp:
```
python whatsapp\conversas_para_csv.py
```## Agradecimentos
Esse repositório está sendo desenvolvido no contexto de uma pesquisa de mestrado financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) realizada no Programa de Pós-Graduação em Sociologia e Antropologia (PPGSA) da Universidade Federal do Rio de Janeiro (UFRJ). O desenvolvimento desse pacote deve muito ao apoio dessas instituições.