LEILA - Librer铆a de calidad de datos
Descripci贸n
La librer铆a de calidad de datos tiene como objetivo principal ser una herramienta que facilite la verificaci贸n de contenido de bases de datos y d茅 m茅tricas de calidad para que usuarios puedan decidir si sus bases de datos necesitan modificarse para ser utilizadas en los proyectos. La librer铆a fue escrita en el lenguaje de programaci贸n de Python y puede analizar bases de datos estructurados que se conviertan en objetos tipo pandas.DataFrame. Contiene tres m贸dulos principales, el m贸dulo Calidad Datos para analizar cualquier base de datos, el m贸dulo Datos gov para conectarse con los metadatos del Portal de Datos Abiertos de Colombia y utilizar sus bases de datos, y por 煤ltimo el m贸dulo Reporte el cual permite generar un reporte de calidad utilizando los m贸dulos anteriores.
La librer铆a surge como resultado de un proyecto relacionado con realizar an谩lisis descriptivos de la calidad de la informaci贸n cargada al portal de Datos Abiertos de Colombia, durante el desarrollo del proyecto se identifica el inter茅s por parte de diferentes actores en el proyecto al igual que el beneficio potencial de tener a la mano una librer铆a que facilite describir la calidad de una base de datos, lo cual motiv贸 a realizar la implementaci贸n de la librer铆a.
- A continuaci贸n podr谩 consultar la siguiente informaci贸n:
Ejemplo
La librer铆a permite generar un reporte de calidad de datos el cual contiene informaci贸n descriptiva del dataframe analizado, a continuaci贸n se presenta el c贸digo requerido para generar un reporte a partir de un archivo en Excel en formato .xlsx.
from leila.reporte import generar_reporte
generar_reporte(datos='datosDeInteres.xlsx')
Documentaci贸n
La librer铆a cuenta con una documentaci贸n que detalla las funciones que la conforman, al igual que ejemplos de uso y dem谩s informaci贸n de inter茅s relacionada con esta, para acceder a la documentaci贸n siga el siguiente link:
Documentaci贸n - LEILA - Librer铆a de calidad de datos.
Instalaci贸n
Para la instalaci贸n de la librer铆a se recomienda utilizar el gestor de paquetes pip
, por buenas pr谩cticas se sugiere antes de la instalaci贸n crear un entorno virtual que permita aislar las librer铆as y evitar conflictos de versiones con el entorno de desarrollo base del computador.
pip install leila
De manera alterna tambi茅n puede utilizar el gestor de paquetes conda
.
conda install -c ucd-dnp leila
Control de cambios
Para ver todos los cambios en las versiones de LEILA
ver el archivo changelog
Contribuciones a LEILA
Todas las contribuciones, reportes de errores, correcci贸n de errores, las mejoras de la documentaci贸n y las ideas son bienvenidas.
Puede encontrar una descripci贸n detallada de c贸mo contribuir en la Wiki de LEILA
Tambi茅n lo invitamos a revisar el
Licencia
MIT License
La librer铆a LEILA - Calidad de datos se encuentra publicada bajo la licencia MIT
Copyleft (c) 2020 - 2021 Departamento Nacional de Planeaci贸n - DNP Colombia
Para mayor informaci贸n puede consultar el archivo de Licencia
Contacto
Para comunicarse con la Unidad de Cient铆ficos de Datos (UCD) de la Direcci贸n de Desarrollo Digital (DDD) del DNP, lo puede hacer mediante el correo electr贸nico ucd@dnp.gov.co