Skip to content

Script / dataset que disponibiliza las defunciones en Chile desde 1998 a 2016

Notifications You must be signed in to change notification settings

verasativa/defunciones-decoder

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Base de datos de defunciones Chile 1998-2016

Base de datos

Este dataset contiene el total de las defunciones registradas por el deis en Chile desde 1998 a 2016.

Archivos

En el data set final encontrarás los siguientes archivos:

  • defunciones-deis-1998-2016-parsed-1M.csv archivo principal que contiene los datos de defunciones en Chile desde 1998 a 2016
  • dtypes.json mapa del tipo de campos del archivo anterior (no es necesario, pero si trabajas en pandas, te ahorrará el trabajo de convertirlos con el código de ejemplo)
  • cie-10.csv mapa jerárquico de códigos de diagnósticos cie-10 (no es necesario, pero te permite convertir de códigos a descripciones los diagnósticos, y navegar su agrupación jerarquica)
  • ejemplo.ipynb jupyter notebook que ejemplifica la carga y análisis de los datos en pandas

Ejemplo de carga en pandas (Python)

# Load defunciones
%matplotlib inline
import pandas as pd
import json

# Dtypes
# Load dtypes from json
with open('dtypes.json') as json_data:
    read_dtypes = json.load(json_data)
date_fields = []

# Capture datetime fields
for col in read_dtypes:
    if read_dtypes[col] == 'datetime64[ns]':
        date_fields.append(col)
        
# Remove datetime fields
for field in date_fields:
    del read_dtypes[field]
    
defunciones = pd.read_csv('defunciones-deis-1998-2016-parsed-1M.csv', dtype=read_dtypes, parse_dates=date_fields,index_col=0)

Investigaciones

Analizamos los diagnósticos primarios en defunciones de menores hasta 16 años, comparando la zona crítica bajo la contaminación del complejo industrial Quintero-Ventanas, contra el resto de Chile como control. Encontramos incidencias de malformaciones congénitas, deformidades y anomalías cromosómicas (CIE-10: Q00-Q99), 3.04 a 3.75 desviaciones estándar sobre el resto del país, con P-values de 0.0001 a 0.00002 en un millón de simulaciones, estimando un impacto de entre 29.73 a 37.8 muertes de menores en la zona crítica por sobre la norma nacional.

Si usas este dataset para alguna investigación, no dudes en hacer un PR de este archivo con tu abstract y link 😉🤓👩🏻‍💻👩🏻‍🔬

Origen y porqué

Los datos originales provienen del deis y fueron argumentados con códigos CIE-10 jerarquizados. Estando los originales en distintos formatos, codificaciones y columnas, dificultaba análisis generales como el que se muestra en el ejemplo.

Pendientes / known issues

  • Valores numericos con 9 o 99 que en realidad son nulos, y deberían ser agregados como tales a los códigos de columnas
  • Generar / revisar mapa de servicios de salud en distintas fechas

App

Los datos crudos de deis fueron organizados en un dataset en floydhub, el que se argumentó con mapas de:

A razón de que desde 1998 se clasifica en códigos CIE-10, se decidió concatenar desde esa fecha para evitar los problemas de concatenar 2 bases de codificación distintas.

Requerimientos

Para completar los requerimientos de software debes ejecutar ./setup.sh y fue ejecutado en una maquina con 32GB en ram, llegó al 60% de uso exportando a csv.

Pull request / contrib

Si mejoras algo, código o documentación, por favor no dudes en enviar un pull request y feliz lo incorporamos.

Agradecimientos

A Naren y Alessio de floydhub por donar 25hrs de servidores CPU2.
A la Biblioteca Gabriela Mistral donde realizó gran parte de este trabajo.

About

Script / dataset que disponibiliza las defunciones en Chile desde 1998 a 2016

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published