Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/smatiolids/datastax-tdc-summit


https://github.com/smatiolids/datastax-tdc-summit

Last synced: 7 days ago
JSON representation

Awesome Lists containing this project

README

        

# DataStax no TDC Summit

O DataStax Astra é um banco NoSQL com suporte a Vector Search para alta escala, volume e performance.

Ao completar este exercício, além do conhecimento e dos brindes, você também receberá um badge para compartilhar em suas redes sociais.

![Badge](./assets/RAG-Challenge-Badge.png)

## Como ganhar o kit da DataStax?

É bem simples. Basta executar este código e preencher o formulário abaixo.

### O que você precisará

- Python
- Uma chave da OpenAI para gerar embeddings e texto (é possível usar a conta `Trial`)
- Uma conta no Astra

### Resumo

- [Crie uma conta gratuita em astra.datastax.com](#3)
- [Clone este repositório](#1)
- [Instale as dependências](#2)
- [Defina as variáveis no arquivo settings.yaml](#4)
- [Execute o app](#5)
- [Carregue arquivos pdf para utilizar como base de conhecimento](#6)
- [Faça perguntas sobre o conteúdo](#6)
- [Preencha o form](#7)
- Passe no nosso estande para dizer o que achou e retirar seu brinde!

A seguir, o detalhe de como fazer cada passo.

# Passo a passo

### Crie uma conta gratuita em astra.datastax.com

Criar uma conta gratuita e um banco de dados vetorial no Astra é muito simples. Além disso, você ganhará **US$ 300 por ano** para utilizar em seus projetos.

- Acesse [astra.datastax.com/signup](https://astra.datastax.com/signup)
- Registre-se com seu usuário Google, GitHUb ou Email e Senha.

Quando sua conta estiver criada, acesse o Astra Dashboard e clique no botão `Create Database`.

Informe o nome do seu banco de dados, provedor de nuvem (AWS, Google Cloud Provider ou Azure) e região da nuvem.

![Astra DB](./assets/step3-db.png)

Pronto! Em cerca de 3 minutos o banco estará disponível para seguir. Enquanto isso, vamos cuidar do código!

### Clone o repositório

O código deste app está disponível neste repositório.

```
git clone https://github.com/smatiolids/datastax-tdc-summit.git
```

### Instale as dependências

Com o Python instalado, instale as bibliotecas

```
pip3 install -r requirements.txt
```
### Defina as variáveis no arquivo settings.yaml

Para que o aplicativo se conecte ao Astra e também à OpenAI, é necessário configurar as variáveis no arquivo `.streamlit/secrets.toml`

- Copie o arquivo `secrets.example.toml` para `secrets.toml`
- Preencha as variáveis com o seguinte

````
OPENAI_API_KEY="sk-"
ASTRA_DB_VECTOR_API_ENDPOINT = ""
ASTRA_DB_VECTOR_TOKEN = ""
````

*Onde encontro os dados do Astra?*

No Astra Dashboard, acesse seu BD e logo na primeira tela, no campo

![Astra Dashboard](./assets/step4-astra.png)

*Onde encontro a chave na OpenAI?*

- Acesse platform.openai.com
- Após fazer login, acesse a área `API`
- No menu, à esquerda, clique no ícone de cadeado
- Crie uma nova chave em `+ Create new secret key`

![OpenAI Secret](./assets/step3-openai.png)

### Execute o app

Para executar o app, execute:

```
streamlit run app.py
```
A aplicação severá iniciar no URL: `http://localhost:8501/`

Você deverá ver a tela:

![Tela de login](./assets/step5-login.png)

Informe o usuário e senha:

username: `datastax`
password: `astra`

### Carregue arquivos pdf para utilizar como base de conhecimento

Na tela inicial, à esquerda, utilize o botão `Browse files` para selecionar os arquivos que estão no diretório `pdf`.

![Tela de login](./assets/step6-files.png)

Clique em gravar e aguarde o processamento. No canto superior haverá um ícone mostrando que o processamento está em execução.

Confira no Astra os dados gravados.

![Tela de login](./assets/step7-data.png)

### Faça perguntas sobre o conteúdo

Pronto, com seus dados carregados, pode fazer perguntas sobre o Astra, como:

- O que é RAG?
- Quais as métricas de similaridade?
- Quais linguagens posso usar?

![RAG](./assets/step8-question.png)

Pronto, você acabou de rodar uma aplicaçãoque usa dados personalizados e IA Generativa!

## Preencha o form com seus dados

Envie seus dados e o Database ID do Astra e envie aqui: https://forms.gle/Se15xCiBoameYDoJ9

Depois, passe no nosso estande para dizer o que achou, se ficou alguma dúvida e tal...

Obrigado por participar!

# Contatos

Samuel Matioli - [email protected]
Nicole Caetano - [email protected]