Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
Resumen
El avance de la tecnolog´ıa y los procesos de secuenciaci´on de genomas de las ´ultimas d´ecadas ha logrado poner al alcance de investigadores de todo el mundo grandes vol´umenes de datos biol´ogicos, que debido a su gran escala, los mismos resultan dif´ıciles de analizar en su totalidad, por lo cual es intuitivo pensar en Inteligencia Artificial para trabajar con dicha informaci´on. Con el objetivo de disminuir la brecha existente entre el investigador y las herramientas de Inteligencia Artificial, se desarroll´o un software que permite crear un espacio de trabajo para un organismo biol´ogico, realizar el procesamiento de los genomas correspondientes y permitir la creaci´on y entrenamiento de modelos de Machine Learning desde una interfaz gr´afica. Los modelos entrenados luego se analizan para buscar qu´e patrones determinan el resultado de la propiedad bi´ologica a investigar sobre el organismo biol´ogico en cuesti´on, y as´ı encontrar los genes de mayor impacto en las predicciones del modelo, permitiendo al investigador el posterior an´alisis en laboratorio de un gen deseado.