Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/smatiolids/datastax-tdc-summit
https://github.com/smatiolids/datastax-tdc-summit
Last synced: 7 days ago
JSON representation
- Host: GitHub
- URL: https://github.com/smatiolids/datastax-tdc-summit
- Owner: smatiolids
- Created: 2024-03-21T15:09:10.000Z (8 months ago)
- Default Branch: main
- Last Pushed: 2024-03-28T16:27:58.000Z (8 months ago)
- Last Synced: 2024-04-22T00:14:28.126Z (7 months ago)
- Language: Python
- Size: 2.35 MB
- Stars: 7
- Watchers: 1
- Forks: 2
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# DataStax no TDC Summit
O DataStax Astra é um banco NoSQL com suporte a Vector Search para alta escala, volume e performance.
Ao completar este exercício, além do conhecimento e dos brindes, você também receberá um badge para compartilhar em suas redes sociais.
![Badge](./assets/RAG-Challenge-Badge.png)
## Como ganhar o kit da DataStax?
É bem simples. Basta executar este código e preencher o formulário abaixo.
### O que você precisará
- Python
- Uma chave da OpenAI para gerar embeddings e texto (é possível usar a conta `Trial`)
- Uma conta no Astra### Resumo
- [Crie uma conta gratuita em astra.datastax.com](#3)
- [Clone este repositório](#1)
- [Instale as dependências](#2)
- [Defina as variáveis no arquivo settings.yaml](#4)
- [Execute o app](#5)
- [Carregue arquivos pdf para utilizar como base de conhecimento](#6)
- [Faça perguntas sobre o conteúdo](#6)
- [Preencha o form](#7)
- Passe no nosso estande para dizer o que achou e retirar seu brinde!A seguir, o detalhe de como fazer cada passo.
# Passo a passo
### Crie uma conta gratuita em astra.datastax.com
Criar uma conta gratuita e um banco de dados vetorial no Astra é muito simples. Além disso, você ganhará **US$ 300 por ano** para utilizar em seus projetos.
- Acesse [astra.datastax.com/signup](https://astra.datastax.com/signup)
- Registre-se com seu usuário Google, GitHUb ou Email e Senha.Quando sua conta estiver criada, acesse o Astra Dashboard e clique no botão `Create Database`.
Informe o nome do seu banco de dados, provedor de nuvem (AWS, Google Cloud Provider ou Azure) e região da nuvem.
![Astra DB](./assets/step3-db.png)
Pronto! Em cerca de 3 minutos o banco estará disponível para seguir. Enquanto isso, vamos cuidar do código!
O código deste app está disponível neste repositório.
```
git clone https://github.com/smatiolids/datastax-tdc-summit.git
```Com o Python instalado, instale as bibliotecas
```
pip3 install -r requirements.txt
```
### Defina as variáveis no arquivo settings.yamlPara que o aplicativo se conecte ao Astra e também à OpenAI, é necessário configurar as variáveis no arquivo `.streamlit/secrets.toml`
- Copie o arquivo `secrets.example.toml` para `secrets.toml`
- Preencha as variáveis com o seguinte````
OPENAI_API_KEY="sk-"
ASTRA_DB_VECTOR_API_ENDPOINT = ""
ASTRA_DB_VECTOR_TOKEN = ""
````*Onde encontro os dados do Astra?*
No Astra Dashboard, acesse seu BD e logo na primeira tela, no campo
![Astra Dashboard](./assets/step4-astra.png)
*Onde encontro a chave na OpenAI?*
- Acesse platform.openai.com
- Após fazer login, acesse a área `API`
- No menu, à esquerda, clique no ícone de cadeado
- Crie uma nova chave em `+ Create new secret key`![OpenAI Secret](./assets/step3-openai.png)
Para executar o app, execute:
```
streamlit run app.py
```
A aplicação severá iniciar no URL: `http://localhost:8501/`Você deverá ver a tela:
![Tela de login](./assets/step5-login.png)
Informe o usuário e senha:
username: `datastax`
password: `astra`### Carregue arquivos pdf para utilizar como base de conhecimento
Na tela inicial, à esquerda, utilize o botão `Browse files` para selecionar os arquivos que estão no diretório `pdf`.
![Tela de login](./assets/step6-files.png)
Clique em gravar e aguarde o processamento. No canto superior haverá um ícone mostrando que o processamento está em execução.
Confira no Astra os dados gravados.
![Tela de login](./assets/step7-data.png)
### Faça perguntas sobre o conteúdo
Pronto, com seus dados carregados, pode fazer perguntas sobre o Astra, como:
- O que é RAG?
- Quais as métricas de similaridade?
- Quais linguagens posso usar?![RAG](./assets/step8-question.png)
Pronto, você acabou de rodar uma aplicaçãoque usa dados personalizados e IA Generativa!
## Preencha o form com seus dados
Envie seus dados e o Database ID do Astra e envie aqui: https://forms.gle/Se15xCiBoameYDoJ9
Depois, passe no nosso estande para dizer o que achou, se ficou alguma dúvida e tal...
Obrigado por participar!
# Contatos
Samuel Matioli - [email protected]
Nicole Caetano - [email protected]