Desarrollo de un clasificador Bayes Naive y una aplicación con datos del flujo vehicular en autopistas de Buenos Aires
Resumen
Se desarrolló un modelo de clasificación para identificar los días laborables a partir del flujo vehicular en estaciones de peaje, considerando los registros de 2019 de las estaciones Illia y Alberti. Cada observación consistió en siete covariables: cuatro variables dicotómicas que identificaron cinco bloques horarios, una variable dicotómica para el sentido de circulación, una variable dicotómica para la estación de peaje, la cantidad de vehículos livianos y la cantidad de vehículos pesados, contabilizados en ambos casos para cada hora reloj, sentido de circulación y estación. Se definieron diez casos de estudio, considerando cada bloque horario y estación, entrenándose un clasificador de Bayes Naive que implementó la regla óptima de Bayes para la decisión de la variable respuesta. Las covariables que contabilizaron el flujo vehicular fueron modeladas como variables aleatorias continuas, estimándose su densidad a través del estimador no paramétrico de Rosenblatt-Parzen basado en núcleos gaussianos, cuya ventana se determinó por convalidación cruzada en diez iteraciones, buscando minimizar el error de clasificación. Cada uno de los estimadores finales se comparó con un estimador de regresión logística sin regularización, obteniendo un menor error de clasificación en el estimador de Bayes Naive en ocho de los diez casos estudiados.