Técnica de visión por computadora predice el comportamiento humano a partir de videos

Una nueva técnica de visión por computadora desarrollada por investigadores de Columbia Engineering puede predecir el comportamiento humano a partir de videos. La nueva técnica le da a las máquinas un sentido intuitivo que les permite predecir lo que sucederá a continuación mediante el uso de asociaciones de alto nivel entre personas, animales y objetos.

Carl Vondrick es profesor asistente de informática en Columbia. Vondrick dirigió el estudiarque se presentó el pasado 24 de junio en la Conferencia Internacional sobre Visión por Computador y Reconocimiento de Patrones.

“Nuestro algoritmo es un paso para que las máquinas puedan hacer mejores predicciones sobre el comportamiento humano y, por lo tanto, coordinar mejor sus acciones con las nuestras”, dijo Vondrick. “Nuestros resultados abren una serie de posibilidades para la colaboración entre humanos y robots, vehículos autónomos y tecnología de asistencia”.

El nuevo método es el más preciso de su tipo hasta la fecha para la predicción de eventos de acción de video varios minutos en el futuro. El sistema primero analizó miles de horas de películas, juegos deportivos y programas antes de pronosticar cientos de actividades, como apretones de manos y choques de puños.

Si el sistema no puede predecir una acción específica, encuentra un concepto de nivel superior que las vincula, como la palabra “saludo”.

intentos pasados

Los intentos anteriores de aprendizaje automático predictivo generalmente se centraron en predecir una acción a la vez, y los algoritmos decidieron clasificar la acción, por ejemplo, como un abrazo, un apretón de manos, chocar los cinco o no actuar. Sin embargo, la alta incertidumbre significa que la mayoría de los modelos de aprendizaje automático no pueden encontrar puntos en común entre las opciones posibles.

El equipo incluía a los estudiantes de doctorado en ingeniería de Columbia, Didac Suris y Ruoshi Liu, y la pareja analizó el problema de predicción a largo plazo de manera un poco diferente.

Suris es coautor principal del artículo.

“No todo en el futuro es predecible”, dijo Suris. “Cuando una persona no puede prever exactamente lo que sucederá, juega a lo seguro y predice a un nivel más alto de abstracción. Nuestro algoritmo es el primero en aprender esta capacidad de razonar de manera abstracta sobre eventos futuros”.

Desarrollo del nuevo sistema

Suris y Liu se basaron en geometrías inusuales para desarrollar modelos de IA que organizan conceptos de alto nivel y predicen el comportamiento humano en el futuro.

Aude Oliva, que no participó en el estudio, es científica investigadora sénior en el Instituto de Tecnología de Massachusetts y codirectora del MIT-IBM Watson AI Lab.

“La predicción es la base de la inteligencia humana”, dijo Oliva. “Las máquinas cometen errores que los humanos nunca cometerían porque carecen de nuestra capacidad de razonar de manera abstracta. Este trabajo es un paso fundamental para cerrar esta brecha tecnológica”.

Los investigadores desarrollaron un marco matemático que permite a las máquinas organizar eventos según lo predecibles que sean en el futuro. Por ejemplo, el nuevo sistema aprende a categorizar actividades como nadar y correr como propias, en lugar de simplemente hacer ejercicio. El sistema también puede dar cuenta de la incertidumbre, lo que conduce a acciones más específicas.

Según Liu, coautor principal del artículo, la técnica recientemente desarrollada podría ayudar a las computadoras a tomar decisiones matizadas en lugar de acciones preprogramadas, y es crucial para generar confianza entre humanos y computadoras.

“La confianza proviene de la sensación de que el robot realmente comprende a las personas”, explica. “Si las máquinas pueden comprender y anticipar nuestros comportamientos, las computadoras podrán ayudar sin problemas a las personas en la actividad diaria”.

El equipo ahora buscará verificar que la técnica funcione en el mundo real, y podría implementarse para la seguridad, la salud y la seguridad.

“El comportamiento humano a menudo sorprende”, dice Vondrick. “Nuestros algoritmos permiten que las máquinas anticipen mejor lo que van a hacer a continuación”.

Deja un comentario