Reconocimiento de expresiones faciales con redes profundas livianas usando Label Distribution Learning y el espacio de Action Units
Resumen
En este trabajo nos enfocamos en el problema de Facial Expression Recognition (FER) y analizamos el uso de Label Distribution Learning en un modelo de Deep Learning liviano. Hoy en día, la búsqueda de soluciones ‘lightweight’ que logren resultados comparables a modelos de deep learning más robustos ha recibido particular atención debido a su implementación factible en dispositivos móviles. Además, considerando
que la mayoría de los datasets de expresiones faciales suelen venir anotados con emociones categóricas cuando en realidad la mayoría de
las expresiones exhibidas en escenarios ‘in the wild’ ocurren como combinaciones o composición de emociones básicas, hacemos uso de Label
Distibution Learning (LDL) como estrategia para el entrenamiento. Asumimos también que las imágenes de expresiones faciales deberían tener una distribución de emoción similar a su vecindad en el espacio de etiquetas de Action Units. Esta información asociada a la distribución de
los vecinos es capturada en la función de perdida para guiar el entrenamiento en LDL y así lograr mejorar los resultados de accuracy sobre el dataset RAFDB.