La capacidad de procesamiento de luz del cerebro humano podría conducir a una mejor detección robótica

El cerebro humano a menudo sirve como inspiración para la inteligencia artificial (IA), y ese es el caso una vez más, ya que un equipo de investigadores del Ejército logró mejorar la detección robótica al observar cómo el cerebro humano procesa la luz brillante y contrastante. El nuevo desarrollo puede ayudar a conducir a la colaboración entre agentes autónomos y humanos.

Según los investigadores, es importante que la detección de máquinas sea efectiva en entornos cambiantes, lo que conduce a desarrollos en la autonomía.

La investigación fue publicada en el Diario de la visión.

Capacidad de visualización de 100 000 a 1

Andre Harrison es investigador en el Laboratorio de Investigación del Ejército del Comando de Desarrollo de Capacidades de Combate del Ejército de EE. UU.

“Cuando desarrollamos algoritmos de aprendizaje automático, las imágenes del mundo real generalmente se comprimen a un rango más estrecho, como lo hace la cámara de un teléfono celular, en un proceso llamado mapeo de tonos”, dijo Harrison. “Esto puede contribuir a la fragilidad de los algoritmos de visión artificial porque se basan en imágenes artificiales que no coinciden con los patrones que vemos en el mundo real”.

El equipo de investigadores desarrolló un sistema con una capacidad de visualización de 100 000 a 1, lo que les permitió obtener información sobre el proceso informático del cerebro en el mundo real. Según Harrison, esto permitió al equipo implementar la resiliencia biológica en los sensores.

Los algoritmos de visión actuales todavía tienen un largo camino por recorrer antes de convertirse en ideales. Esto tiene que ver con el rango limitado de luminancia, en una proporción de alrededor de 100 a 1, debido a que los algoritmos se basan en estudios en humanos y animales con monitores de computadora. La proporción de 100 a 1 es menos que ideal en el mundo real, donde la variación puede llegar hasta 100 000 a 1. Esta alta relación se denomina alto rango dinámico o HDR.

El Dr. Chou Po Hung es un investigador del Ejército.

“Los cambios y las variaciones significativas en la luz pueden desafiar los sistemas del Ejército: los drones que vuelan bajo el dosel de un bosque pueden confundirse con los cambios de reflectancia cuando el viento sopla a través de las hojas, o los vehículos autónomos que conducen en terreno accidentado pueden no reconocer los baches ni otros obstáculos porque las condiciones de iluminación son ligeramente diferentes de aquellos en los que se entrenaron sus algoritmos de visión”, dijo Hung.

La capacidad de compresión del cerebro humano

El cerebro humano es capaz de comprimir automáticamente la entrada de 100 000 a 1 en un rango más estrecho, y esto es lo que permite a los humanos interpretar la forma. El equipo de investigadores se propuso comprender este proceso estudiando el procesamiento visual temprano bajo HDR. El equipo buscó características simples como la luminancia HDR.

“El cerebro tiene más de 30 áreas visuales, y todavía tenemos solo una comprensión rudimentaria de cómo estas áreas procesan la imagen del ojo para comprender la forma 3D”, continuó Hung. “Nuestros resultados con los estudios de luminancia HDR, basados ​​en el comportamiento humano y las grabaciones del cuero cabelludo, muestran lo poco que sabemos realmente sobre cómo cerrar la brecha entre el laboratorio y los entornos del mundo real. Pero estos hallazgos nos sacan de esa caja, mostrando que nuestras suposiciones previas de los monitores de computadora estándar tienen una capacidad limitada para generalizar al mundo real, y revelan principios que pueden guiar nuestro modelado hacia los mecanismos correctos”.

Al descubrir cómo interactúan los bordes de luz y contraste en la representación visual del cerebro, los algoritmos serán más efectivos para reconstruir el mundo 3D bajo la luminancia del mundo real. Al estimar la forma 3D a partir de información 2D, siempre hay ambigüedades, pero este nuevo descubrimiento permite corregirlas.

“A través de millones de años de evolución, nuestros cerebros han desarrollado atajos efectivos para reconstruir 3D a partir de información 2D”, dijo Hung. “Es un problema de hace décadas que continúa desafiando a los científicos de visión artificial, incluso con los avances recientes en IA”.

El descubrimiento del equipo también es importante para el desarrollo de dispositivos de inteligencia artificial como el radar y la comprensión remota del habla, que utilizan detección de amplio rango dinámico.

“La cuestión del rango dinámico no es solo un problema de detección”, dijo Hung. “También puede ser un problema más general en la computación cerebral porque las neuronas individuales tienen decenas de miles de entradas. ¿Cómo construye algoritmos y arquitecturas que puedan escuchar las entradas correctas en diferentes contextos? Esperamos que, al trabajar en este problema a nivel sensorial, podamos confirmar que estamos en el camino correcto, para que podamos tener las herramientas adecuadas cuando construimos IA más complejos”.

Deja un comentario