An open API service indexing awesome lists of open source software.

https://github.com/arthurcoutinho15/amazon_scrapy


https://github.com/arthurcoutinho15/amazon_scrapy

python selenium

Last synced: about 2 months ago
JSON representation

Awesome Lists containing this project

README

          

Web Scraping Notebooks Amazon


Descrição


Este projeto realiza a coleta de dados de notebooks do site Amazon, transforma, e carrega esses dados em um banco MySQL.
Em seguida, gera um dashboard interativo utilizando Streamlit para visualização da distribuilção de preços e avaliações.


Configuração



  1. Clone esse repositório

  2. https://github.com/ArthurCoutinho15/amazon_scrapy

    Instale as dependências necessárias:
    pip install -r requirements.txt

    Crie um arquivo .env na raiz do projeto com as seguintes variáveis:
    HOST=your_mysql_host
    USER=your_mysql_user
    PASSWORD=your_mysql_password
    DB_NAME_PROD=your_database_name


Bibliotecas Utilizadas



  • Selenium

  • Pandas

  • SQLAlchemy

  • dotenv

  • Streamlit


Execução


  • Crie um banco de dados amazon e a seguinte tabela

  • 
    
    USE amazon;
    CREATE TABLE products(
    name varchar (150),
    price float,
    rating int,
    mean_rating float,
    link varchar (200)
    );

    Utilização do Streamlit



    O Streamlit é utilizado para criar um dashboard interativo que mostra os dados de notebooks vendidos na amazon.

    Execução do Streamlit



    1. Certifique-se de que o ambiente virtual está ativado.

    2. Execute o comando para iniciar o Streamlit:

      streamlit run script.py

      Substitua script.py pelo nome do arquivo Python que contém o código acima.



    3. Abra o navegador e acesse http://localhost:8501 para visualizar o dashboard.