An open API service indexing awesome lists of open source software.

https://github.com/wlopezm-unal/proyecto-tic

RPA process using Aws client. Where the final steps is a bucket S3 where it gonna save this data
https://github.com/wlopezm-unal/proyecto-tic

Last synced: 3 months ago
JSON representation

RPA process using Aws client. Where the final steps is a bucket S3 where it gonna save this data

Awesome Lists containing this project

README

        

----------------------------------------------------------------------------------------------------------------------
Correr el script de web scraping usando el cliente SSH

----------------------------------------------------------------------------------------------------------------------
1. Instalar dependencias
* sudo apt-get update
* sudo apt update

2. Clonar el repositorio github
* git clone https://github.com/wlopezm-unal/proyecto-tic
3. Crear el entorno virtual para poder ejecutar el script
* sudo install python3-pip
* sudo apt install python3-venv
* pip install -r requeriments.txt
4. Ejecutar el script scraping.py
* python3 scraping.py

----------------------------------------------------------------------------------------------------------------------
Pasar el archivo csv generado por el web scraping a s3 usando AWS CLI del usando el cliente SSH

----------------------------------------------------------------------------------------------------------------------
Pasos para poder subir tu archivo CSV a un bucket de S3 desde tu instancia EC2 usando PuTTY
1. Instalar las dependencias
* sudo apt install unzip curl -y

2. Descargar la aws cli
* curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"

3. Descomprimir el archivo descargado
* unzip awscliv2.zip

4. Instalar la AWS CLI
* sudo ./aws/install

5. aws --version
* aws --version

6. Configurar la AWS CLI
* aws configure

Te pedirá ingresar los siguientes datos:

AWS Access Key ID: Ingresa tu Access Key ID.
AWS Secret Access Key: Ingresa tu Secret Access Key.
Default region name: Ingresa tu región predeterminada, por ejemplo, us-west-2.
Default output format: Puedes dejarlo en blanco o escribir json

7. Subir el archivo CSV a S3
* cd proyecto-tic
* aws s3 cp datos_liga_inglesa_2024.csv s3://proyecto-bucket/datos_liga_inglesa_2024.csv