ETL para la integración de datos de sensado remoto
Resumen
Los satélites modernos que están en órbita y otras herramientas de teledetección disponibles han generado una enorme disponibilidad de datos públicos a la espera de ser explotados, los cuales están alojados en diferentes servidores y en distintos formatos. En este contexto, el formalismo ETL (Extracción, Transformación y Carga, por sus siglas en inglés) cobra relevancia para la integración y análisis de la información combinada de todas estas fuentes. A lo largo de este trabajo se presentan los fundamentos teóricos y prácticos para construir una infraestructura de análisis modular que permita la creación de ETLs para descargar, transformar e integrar datos procedentes de diferentes instrumentos en distintos formatos. Parte de este trabajo ya está implementado en una librería Python que se pretende integrar en herramientas de gestión de flujos de trabajo ya disponibles basadas en grafos acíclicos-dirigidos que también disponen de diferentes adaptadores para impactar los datos combinados en diferentes warehouses.