Investigadores de la Universidad Estatal de Oregón han demostrado el potencial de la inteligencia artificial para imitar a los humanos con un nuevo sensor óptico. Este sensor óptico es mejor para imitar la capacidad del ojo humano para percibir cambios en su campo visual.
El desarrollo tiene grandes implicaciones para campos como el reconocimiento de imágenes, la robótica y la IA.
La investigación, que fue dirigida por el investigador de la Facultad de Ingeniería de OSU John Labram y la estudiante graduada Cinthya Trujillo Herrera, se publicó a principios de este mes en Letras de Física Aplicada.
Dispositivos previos para el ojo humano
Los investigadores habían intentado anteriormente desarrollar tipos de dispositivos para el ojo humano, también llamados sensores retinomórficos, y a menudo usaban software o hardware complejo. Sin embargo, este nuevo dispositivo utiliza capas ultrafinas de semiconductores de perovskita, que han llamado la atención en el pasado debido a su potencial para el uso de energía solar. Cuando se exponen a la luz, estas capas ultrafinas pasan de ser fuertes aislantes eléctricos a fuertes conductores.
Labram es profesor asistente de ingeniería eléctrica y ciencias de la computación, y dirige la investigación con el apoyo de la Fundación Nacional de Ciencias.
“Puede pensar en ello como un solo píxel que hace algo que actualmente requeriría un microprocesador”, dijo Labram.
Se espera que la próxima generación de IA esté impulsada por computadoras neuromórficas, específicamente en aplicaciones como vehículos autónomos, robótica y reconocimiento de imágenes avanzado. Las computadoras neuromórficas imitan las redes paralelas del cerebro humano, mientras que las computadoras tradicionales procesan la información de manera secuencial.
“La gente ha tratado de replicar esto en hardware y ha tenido un éxito razonable”, dijo Labram. “Sin embargo, a pesar de que los algoritmos y la arquitectura diseñados para procesar información se parecen cada vez más a un cerebro humano, la información que reciben estos sistemas todavía está decididamente diseñada para computadoras tradicionales”.
Todo esto significa que una computadora necesita un sensor de imagen para actuar como el ojo humano, que consta de alrededor de 100 millones de fotoceptores. A pesar de este número masivo, el nervio óptico solo contiene 1 millón de conexiones con el cerebro, lo que significa que la retina es testigo de una gran cantidad de preprocesamiento y compresión dinámica antes de que se transmita una imagen.
Sensor retinomorfo
El sensor retinomórfico desarrollado por los investigadores no reacciona fuertemente en condiciones estáticas, pero registra señales cortas y agudas cuando hay un cambio en la iluminación. Luego vuelve rápidamente a la línea de base, que se debe a las perovskitas.
“La forma en que lo probamos es, básicamente, lo dejamos en la oscuridad por un segundo, luego encendemos las luces y las dejamos encendidas”, dijo Labram. “Tan pronto como se enciende la luz, se obtiene un gran pico de voltaje, luego el voltaje decae rápidamente, aunque la intensidad de la luz es constante. Y eso es lo que queremos”.
El equipo simuló varios sensores retinomórficos, lo que les permitió predecir cómo reaccionaría una cámara de video retinomórfica al estímulo de entrada.
“Podemos convertir video a un conjunto de intensidades de luz y luego poner eso en nuestra simulación”, dijo Labram. “Las regiones en las que se predice una salida de mayor voltaje del sensor se iluminan, mientras que las regiones de menor voltaje permanecen oscuras. Si la cámara es relativamente estática, puede ver claramente que todas las cosas que se mueven responden con fuerza. Esto se mantiene razonablemente fiel al paradigma de la detección óptica en mamíferos”.
“Lo bueno es que, con esta simulación, podemos ingresar cualquier video en una de estas matrices y procesar esa información esencialmente de la misma manera que lo haría el ojo humano”, continuó Labram. “Por ejemplo, puede imaginar que estos sensores son utilizados por un robot que sigue el movimiento de los objetos. Cualquier cosa estática en su campo de visión no provocaría una respuesta, sin embargo, un objeto en movimiento estaría registrando un alto voltaje. Esto le diría al robot inmediatamente dónde estaba el objeto, sin ningún procesamiento de imagen complejo”.