Proyecto sobre reconocimiento de acciones en los videos sobre un dominio concreto, el baile. En primer lugar, se entrenan dos modelos con dos enfoques diferentes utilizando el dataset de Let's Dance
En segundo lugar, se implementa una API básica con Flask que contiene dos servicios, un servicio por modelo, para testear cada modelo con videos no vistos por el modelo durante el entrenamiento. Cada servicio de la API recibe una url y devuelve un json con la etiqueta y la confianza del modelo sobre la predicción para cada clase que es capaz de renocer. En este experimento el modelo aprendió a renocer 4 tipos de baile (ballet, break dance, flamenco y waltz).
El primer modelo usa transfer learning sobre un modelo pre-entrenado. El segundo modelo fue entrenado creando una red convolucional usando filtros convolucionales 3D para reconocer las características espacio-temporales en una secuencia de frames. Estos fueron los resultados obtenidos y las condiciones de entrenamiento.
References: Castro, D. (2018, January 23). Let’s Dance: Learning From Online Dance Videos. ArXiv.Org. https://arxiv.org/abs/1801.07388