Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
Projects in Awesome Lists by xpcosmos
A curated list of projects in awesome lists by xpcosmos .
https://github.com/xpcosmos/downloads-pretty
Quantas vezes não procuramos um documento e derepente... Não estava onde você achava que estava. As vezes isso ocorre por conta da bagunça que são nossas pastas. Pensando nisso, desenvolvi um script para automatizar a organização de arquivos dentro do Linux!
bash bash-script linux linux-shell shell shell-script
Last synced: 14 Nov 2024
https://github.com/xpcosmos/modelos_regressao_linear
Repositório com todos os modelos de regressão linear desenvolvidos para fins de estudo!
Last synced: 14 Nov 2024
https://github.com/xpcosmos/classificao-multilabel
Nesse projeto utilizei as bibliotecas e ferramentas mais populares para resolução de um problema de identificação de tags em discursões do StackOverFlow. Através de técnicas de NLP, os dados textuais foram transformados e realizada a aplicação dos algoritmos de classificação de múltiplas labels.
labels matplotlib multilabel-classification numpy pandas python seaborn sklearn
Last synced: 14 Nov 2024
https://github.com/xpcosmos/injestao-dados-enem-sql
Esse projeto tem o objetivo de estruturar dados do enem em bancos de dados e analisar os dados utilizando métodos estatísticos.
docker docker-compose postgresql pyspark python spark sql statistics
Last synced: 14 Nov 2024
https://github.com/xpcosmos/deteccao-de-fraudes
O presente projeto tem o objetivo de explorar técnicas de classificação aplicadas na detecção de fraudes bancárias. Foi utilizado um conjunto de dados com poucos registros e que apresentava um comum problema do mundo real, o desbalanceamento de dados. Foi utilizado técnicas de pré-processamento do SKlearn como o OneHotEncoder.
Last synced: 14 Nov 2024
https://github.com/xpcosmos/initialize_project
The "Data Science Project Initialization Script" is a Bash script designed to streamline the setup process for a Python-based data science project. Authored by Mikeias Oliveira, this script automates the creation of a well-organized directory structure, essential files, and a virtual environment for a data science project.
Last synced: 14 Nov 2024
https://github.com/xpcosmos/from_scratch
Esse projeto tem o objetivo de aprimorar minhas habilidades práticas e teóricos em modelos de aprendizado e modelos estatístico. Serão selecionados alguns modelos e o desafio proposto é o desenvolvimento de modelos amplamente conhecidos, escritos do zero.
Last synced: 14 Nov 2024
https://github.com/xpcosmos/jaffle-shop
Modern Data Stack with DBT, PySpark, PostgresSQL and Docker
dbt docker docker-compose pyspark python spark
Last synced: 12 Oct 2024
https://github.com/xpcosmos/physical-data-model-mysql
It utilizes a MySQL server set up on a Red Hat Enterprise Linux 9 (RHEL 9) virtual machine (VM). The VM configuration demonstrates the potential for the database server to be accessed by other hosts on the network. The project includes various SQL scripts within the database folder, demonstrating functionalities like creating a schema and more!
data-engineering database dba mysql-database rhel9 sql utm
Last synced: 14 Nov 2024
https://github.com/xpcosmos/data-lake-prime
This project aims to simulate and configure a Distributed File System using Hadoop HDFS. For this project, 3 machines were created: 1 Master Node and 2 Worker Nodes.
hadoop hadoop-cluster hadoop-hdfs hdfs network
Last synced: 14 Nov 2024
https://github.com/xpcosmos/etl-process
ETL application with multi-node PySpark and PostgreSQL running in Docker containers
Last synced: 14 Nov 2024