Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición

  • Agustín Nicolás Dramis Grupo de Bioestadística Aplicada (GBA, FCEyN-UBA), Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina(CONICET
  • María Soledad Fernández Grupo de Bioestadística Aplicada (GBA, FCEyN-UBA), Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina(CONICET
  • Adriana Alicia Pérez Grupo de Bioestadística Aplicada (GBA, FCEyN-UBA)
  • Pablo Guillermo Turjanski Grupo de Bioestadística Aplicada (GBA, FCEyN-UBA), Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina(CONICET
Palabras clave: Calidad de datos - Simulación - Datos antropométricos.

Resumen

El registro sistemático de medidas antropométricas permite evaluar el estado nutricional de poblaciones, siendo un insumo fundamental para diseñar, dirigir y evaluar políticas públicas. Las medidas antropométricas suelen ser recolectadas en un proceso de registro manual por parte de los profesionales de la salud. Este proceso acarrea la aparición de errores de carga pudiendo impactar en la evaluación del estado nutricional de la población. Para remediarlo la OMS introdujo pautas de remoción de datos individualmente no plausibles. Sin embargo, no son consideradas suficientes para la detección de la totalidad de los errores. Existen métodos que detectan inconsistencias longitudinales en registros de un mismo individuo. En este trabajo simulamos una base de datos antropométrica (basados en una real), a la que aplicamos aleatoriamente cuatro tipos de errores descritos en la literatura. Observamos el impacto de los mismos y el del proceso de limpieza (transversal y longitudinal), sobre la prevalencia de un indicador de malnutrición. Se encontró un aumento de la prevalencia luego de introducir cada tipo de error, y un acercamiento a los valores originales de prevalencia luego de los procesos de limpieza, evidenciando la importancia de aplicar estos procesos de data cleaning previo a analizar los indicadores nutricionales.

Publicado
2023-07-21
Cómo citar
Dramis, A., Fernández, M., Pérez, A., & Turjanski, P. (2023). Análisis del impacto del proceso de data cleaning sobre indicadores de malnutrición. Memorias De Las JAIIO, 9(5), 20-27. Recuperado a partir de https://ojs.sadio.org.ar/index.php/JAIIO/article/view/740
Sección
CAIS - Congreso Argentino de Informática y Salud