Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/verasativa/defunciones-decoder

Script / dataset que disponibiliza las defunciones en Chile desde 1998 a 2016
https://github.com/verasativa/defunciones-decoder

Last synced: about 2 months ago
JSON representation

Script / dataset que disponibiliza las defunciones en Chile desde 1998 a 2016

Awesome Lists containing this project

README

        

# Base de datos de defunciones Chile 1998-2016
### Base de datos
Este dataset contiene el total de las defunciones registradas por el [deis](http://www.deis.cl/bases-de-datos-defunciones/) en Chile desde 1998 a 2016.
#### Archivos
En el [data set final](https://www.floydhub.com/veras/datasets/defunciones) encontrarás los siguientes archivos:

- ```defunciones-deis-1998-2016-parsed-1M.csv``` archivo principal que contiene los datos de defunciones en Chile desde 1998 a 2016
- ```dtypes.json``` mapa del tipo de campos del archivo anterior (no es necesario, pero si trabajas en pandas, te ahorrará el trabajo de convertirlos con el código de ejemplo)
- ```cie-10.csv``` mapa jerárquico de códigos de diagnósticos cie-10 (no es necesario, pero te permite convertir de códigos a descripciones los diagnósticos, y navegar su agrupación jerarquica)
- ```ejemplo.ipynb``` jupyter notebook que ejemplifica la carga y análisis de los datos en pandas

#### Ejemplo de carga en pandas (Python)
```Python
# Load defunciones
%matplotlib inline
import pandas as pd
import json

# Dtypes
# Load dtypes from json
with open('dtypes.json') as json_data:
read_dtypes = json.load(json_data)
date_fields = []

# Capture datetime fields
for col in read_dtypes:
if read_dtypes[col] == 'datetime64[ns]':
date_fields.append(col)

# Remove datetime fields
for field in date_fields:
del read_dtypes[field]

defunciones = pd.read_csv('defunciones-deis-1998-2016-parsed-1M.csv', dtype=read_dtypes, parse_dates=date_fields,index_col=0)
```

#### Investigaciones

[Analizamos los diagnósticos primarios en defunciones de menores hasta 16 años, comparando la zona crítica bajo la contaminación del complejo industrial Quintero-Ventanas, contra el resto de Chile como control. Encontramos incidencias de malformaciones congénitas, deformidades y anomalías cromosómicas (CIE-10: Q00-Q99), 3.04 a 3.75 desviaciones estándar sobre el resto del país, con P-values de 0.0001 a 0.00002 en un millón de simulaciones, estimando un impacto de entre 29.73 a 37.8 muertes de menores en la zona crítica por sobre la norma nacional.](https://github.com/verasativa/zonacritica)

__Si usas este dataset para alguna investigación, no dudes en hacer un PR de este archivo con tu abstract y link 😉🤓👩🏻‍💻👩🏻‍🔬__

### Origen y porqué
Los datos originales provienen del [deis](http://www.deis.cl/bases-de-datos-defunciones/) y fueron argumentados con [códigos CIE-10 jerarquizados](https://github.com/verasativa/CIE-10). Estando los originales en distintos formatos, codificaciones y columnas, dificultaba análisis generales como el que se muestra en el ejemplo.

### Pendientes / known issues
- Valores numericos con 9 o 99 que en realidad son nulos, y deberían ser agregados como tales a los [códigos de columnas](https://www.floydhub.com/veras/datasets/defunciones-deis/5/_ref/columns_codes.csv)
- Generar / revisar mapa de servicios de salud en distintas fechas

### App
Los datos crudos de deis fueron organizados en un [dataset en floydhub](https://www.floydhub.com/veras/datasets/defunciones-deis/), el que se argumentó con mapas de:
- [Códigos CIE-10](https://github.com/verasativa/CIE-10)
- [Códigos de comunas históricas del deis](https://www.floydhub.com/veras/datasets/defunciones-deis/5/_ref/Divisio%CC%81n-Poli%CC%81tico-Administrativa-y-Servicios-de-Salud-Histo%CC%81rico.xls)
- [Códigos de columnas](https://www.floydhub.com/veras/datasets/defunciones-deis/5/_ref/columns_codes.csv) a partir del [ezquesma de registro de deis](https://www.floydhub.com/veras/datasets/defunciones-deis/5/_ref/EsquemaRegistroDefunciones.pdf)

A razón de que desde 1998 se clasifica en códigos CIE-10, se decidió concatenar desde esa fecha para evitar los problemas de concatenar 2 bases de codificación distintas.

#### Requerimientos
Para completar los requerimientos de software debes ejecutar ```./setup.sh``` y fue ejecutado en una maquina con 32GB en ram, llegó al 60% de uso exportando a csv.

#### Pull request / contrib
Si mejoras algo, código o documentación, por favor no dudes en enviar un pull request y feliz lo incorporamos.
### Agradecimientos
A Naren y Alessio de [floydhub](https://www.floydhub.com/) por donar 25hrs de servidores CPU2.
A la [Biblioteca Gabriela Mistral](http://www.nunoa.cl/index.php/municipio/unidades-municipales/direccion-de-desarrollo-comunitario/biblioteca-gabriela-mistral.html) donde realizó gran parte de este trabajo.