leila

Librer铆a para medir la calidad de los datos en conjuntos de datos estructurados


Keywords
Python, Calidad, de, datos, UCD, DNP, data-quality, data-science, eda, espanol, exploratory-data-analysis, report-generator
License
MIT
Install
pip install leila==0.2

Documentation

LEILA - Librer铆a de calidad de datos

screenshot

PyPI version fury.io PyPI pyversions PyPI license Downloads GitHub forks

Descripci贸n

La librer铆a de calidad de datos tiene como objetivo principal ser una herramienta que facilite la verificaci贸n de contenido de bases de datos y d茅 m茅tricas de calidad para que usuarios puedan decidir si sus bases de datos necesitan modificarse para ser utilizadas en los proyectos. La librer铆a fue escrita en el lenguaje de programaci贸n de Python y puede analizar bases de datos estructurados que se conviertan en objetos tipo pandas.DataFrame. Contiene tres m贸dulos principales, el m贸dulo Calidad Datos para analizar cualquier base de datos, el m贸dulo Datos gov para conectarse con los metadatos del Portal de Datos Abiertos de Colombia y utilizar sus bases de datos, y por 煤ltimo el m贸dulo Reporte el cual permite generar un reporte de calidad utilizando los m贸dulos anteriores.

La librer铆a surge como resultado de un proyecto relacionado con realizar an谩lisis descriptivos de la calidad de la informaci贸n cargada al portal de Datos Abiertos de Colombia, durante el desarrollo del proyecto se identifica el inter茅s por parte de diferentes actores en el proyecto al igual que el beneficio potencial de tener a la mano una librer铆a que facilite describir la calidad de una base de datos, lo cual motiv贸 a realizar la implementaci贸n de la librer铆a.

Ejemplo

La librer铆a permite generar un reporte de calidad de datos el cual contiene informaci贸n descriptiva del dataframe analizado, a continuaci贸n se presenta el c贸digo requerido para generar un reporte a partir de un archivo en Excel en formato .xlsx.

from leila.reporte import generar_reporte

generar_reporte(datos='datosDeInteres.xlsx')

screenshot

Documentaci贸n

La librer铆a cuenta con una documentaci贸n que detalla las funciones que la conforman, al igual que ejemplos de uso y dem谩s informaci贸n de inter茅s relacionada con esta, para acceder a la documentaci贸n siga el siguiente link:

Documentaci贸n - LEILA - Librer铆a de calidad de datos.

Instalaci贸n

Para la instalaci贸n de la librer铆a se recomienda utilizar el gestor de paquetes pip, por buenas pr谩cticas se sugiere antes de la instalaci贸n crear un entorno virtual que permita aislar las librer铆as y evitar conflictos de versiones con el entorno de desarrollo base del computador.

pip install leila

De manera alterna tambi茅n puede utilizar el gestor de paquetes conda.

conda install -c ucd-dnp leila

Control de cambios

Para ver todos los cambios en las versiones de LEILA ver el archivo changelog

Contribuciones a LEILA

Todas las contribuciones, reportes de errores, correcci贸n de errores, las mejoras de la documentaci贸n y las ideas son bienvenidas.

Puede encontrar una descripci贸n detallada de c贸mo contribuir en la Wiki de LEILA

Tambi茅n lo invitamos a revisar el 馃搯 Tablero TODO de LEILA, donde hay una serie de temas listados en los que el equipo UCD se encuentra trabajando.

Licencia MIT license

MIT License

La librer铆a LEILA - Calidad de datos se encuentra publicada bajo la licencia MIT
Copyleft (c) 2020 - 2021 Departamento Nacional de Planeaci贸n - DNP Colombia

Para mayor informaci贸n puede consultar el archivo de Licencia

Contacto

Para comunicarse con la Unidad de Cient铆ficos de Datos (UCD) de la Direcci贸n de Desarrollo Digital (DDD) del DNP, lo puede hacer mediante el correo electr贸nico ucd@dnp.gov.co