Selección de algoritmos de preprocesamiento de datos del Hospital Delicia Concepción Masvernat (Concordia, provincia de Entre Ríos) que permita el desarrollo de un componente de software para predicción de enfermedades cardiológicas.
Resumen
El sector sanitario, sin lugar a dudas es uno de los ámbitos en el que se administran grandes volúmenes de datos; principalmente en el área clínica.
Esto conduce a identificar una importante necesidad de encontrar maneras de
administrar, integrar, analizar e interpretar ese gran conjunto de datos; procurando identificar patrones de comportamiento que sean de utilidad en la
toma de decisiones médicas. El proyecto de investigación1 en el que se enmarca este artículo plantea como principal objetivo desarrollar un componente de software capaz de generar, con aprendizaje automatizado, un modelo con capacidades predictivas sobre enfermedades cardiológicas; que permita un mejor soporte a decisiones de diagnóstico clínico y un avance significativo en la medicina preventiva. Este artículo presenta una revisión exhaustiva de las herramientas de preprocesamiento de datos para analizar datos sanitarios masivos, en términos de la imputación de valores perdidos, detección de valores atípicos, reducción, escalado, transformación y partición de datos. Además, se proponen herramientas de ciencia de datos en el campo sanitario. Se ha presentado un análisis en profundidad para describir los pros y los contras de las herramientas existentes para abordar los desafíos prácticos. Los resultados obtenidos son útiles para el desarrollo de investigaciones basadas en predicción de enfermedades en el campo sanitario.