Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/dp6/penguin-datalayer
Crawler assistido para validação de objetos enviados à camada de dados (Data Layer)
https://github.com/dp6/penguin-datalayer
data-quality data-quality-checks datalayer dp6 gtm hacktoberfest json-schema nodejs raft-suite
Last synced: 22 days ago
JSON representation
Crawler assistido para validação de objetos enviados à camada de dados (Data Layer)
- Host: GitHub
- URL: https://github.com/dp6/penguin-datalayer
- Owner: DP6
- Created: 2021-01-07T20:02:13.000Z (almost 4 years ago)
- Default Branch: master
- Last Pushed: 2023-03-07T13:27:46.000Z (almost 2 years ago)
- Last Synced: 2024-11-28T23:32:29.448Z (28 days ago)
- Topics: data-quality, data-quality-checks, datalayer, dp6, gtm, hacktoberfest, json-schema, nodejs, raft-suite
- Language: JavaScript
- Homepage: https://dp6.github.io/penguin-datalayer
- Size: 1.01 MB
- Stars: 7
- Watchers: 25
- Forks: 5
- Open Issues: 13
-
Metadata Files:
- Readme: README.md
- Contributing: CONTRIBUTING.md
- Code of conduct: CODE_OF_CONDUCT.md
Awesome Lists containing this project
README
# Penguin DataLayer
O Penguin DataLayer é uma ferramenta Open Source desenvolvida pela DP6 que tem como intuito auxiliar no processo de validação da implementação da camada de dados (Data Layer), através de um modelo de dados (schema) que represente com fidelidade as chaves, valores, tipos de dados esperados.
A ferramenta atua como um crawler, acompanhando os disparos efetuados para o Data Layer, e validando cada objeto enviado com base no schema entregue à esta.## Conteúdo
- [Conteúdo](#conteúdo)
- [Instalação](#instalação)
- [Como Utilizar](#como-utilizar)
- [JSON Schema](#json-schema)
- [Tipos Suportados](#tipos-suportados)
- [Regras de validação](#regras-de-validação)
- [Estrutura do JSON Schema](#estrutura-do-json-schema)### Instalação
Para instalar a versão atual:
` npm install -i`
Após a instalação da biblioteca, a estrutura de diretórios deve ser a seguinte:
```bash
├── config
├── lib
├── results
└── schema
```### Como Utilizar
O DataLayer Penguin realiza a validação de hits enviados para a Camada de Dados (Data Layer).
Para garantir que o hit que foi enviado está estruturado da forma correta e com os valores esperados, faz-se necessária a inclusão de dois arquivos que são gerados manualmente, sendo estes:- JSON Schema
- ConfigTanto o JSON Schema quanto o arquivo de config são gerados através da seguinte planilha:
[Ludwig - Schema & Config](https://docs.google.com/spreadsheets/d/1U1YbPmRQDvUv4X8m0I8GYNr8pXR8ADYttzKw79NIlcQ/edit#gid=631532070)O arquivo de configurações para a execução do DataLayer Penguin deve ser inserido na pasta **config**, e o JSON Schema na pasta **schema**, respectivamente
```bash
├── config
│ ├── config_example.json
├── results
└── schema
├── schema_example.json
```Para execução do validador, é esperado como parâmetro o arquivo de configuração, conforme demonstrado no exemplo a seguir:
`npm start config_example.json`
Para a execução do validador com o adblock pausado basta seguir o exemplo a seguir:
`npm start config_example.json stopAdBlock`
Após executar o comando, o validador iniciará uma instância do _Chromium_, lendo as configurações da URL de início, nome da camada de dados e o JSON Schema para validação.
Os hits que forem disparados de forma automática para a camada de dados e estiverem declarados no JSON Schema serão validados de forma automática. Entretanto, o validador necessitará de interação humana caso haja algum hit que necessita de uma ação (click, preenchimento de form, etc.) para ser disparado.
Por padrão, os logs com a validação serão disponibilizados na pasta **results**, em pdf ou xlsx, dependendo do parâmetro que for passado na linha de comando que executa o DataLayer Penguin, como por exemplo:
```nodejs
npm start config_example.json pdf
```ou
```nodejs
npm start config_example.json xlsx
```### JSON Schema
O JSON Schema é uma estrutura que permite a **validação** de documentos JSON. Esta estrutura é utilizada no projeto pois permite a declaração dos formatos de dados esperados dentro da camada de dados.
#### Tipos Suportados
Os seguintes tipos de dados são suportados:
- String
- Number
- Boolean
- Object
- Array#### Regras de validação
As seguintes regras para validação são aceitas:
- **Enum (Equals)**: A ser utilizada quando houver a necessidade de validar a **igualdade** entre o valor informado no schema _versus_ o que foi enviado para a camada de dados
- **Pattern (Regex - String)**: É possível criar expressões regulares para validar valores das chaves
- **minItems (Array)**: Valida o número mínimo de itens contidos no array
- **Required**: Quando houver a obrigatoriedade de validar uma determinada chave#### Estrutura do JSON Schema
A estrutura a seguir é um exemplo de um JSON Schema:
```json
{
"$schema": "",
"title": "Schema example",
"array": {
"$id": "#/properties/schema",
"type": "array",
"items": [
{
"type": "object",
"properties": {
"event": {
"type": "string",
"enum": ["teste"]
},
"key1": {
"type": "object",
"properties": {
"key1_sub1": {
"type": "number"
},
"key1_sub2": {
"type": "string",
"pattern": "teste|test|.*"
},
"key1_sub3": {
"type": "string",
"enum": ["producao"]
},
"key1_sub4": {
"type": "boolean"
}
},
"required": ["key1_sub1", "key1_sub2", "key1_sub3", "key1_sub4"]
}
},
"required": ["event"]
}
]
}
}
```## Como contribuir
Pull requests são bem-vindos! Nós vamos adorar ajuda para evoluir esse modulo. Senta-se livre para navegar por open issues buscando por algo que possa fazer. Caso temha uma nova feature ou bug, por favor abra uma nova issue para ser acompanhada pelo nosso time.
### Requisitos obrigatórios
Só serão aceito as contribuições que estiverem seguindo os seguintes requisitos:
- [Padrão de commit](https://www.conventionalcommits.org/en/v1.0.0/)
## Suporte:
**DP6 Koopa-troopa Team**
_e-mail: _