El modelo de IA puede tomar imágenes borrosas y mejorar la resolución 60 veces

Investigadores de la Universidad de Duke han desarrollado un modelo de IA capaz de tomar imágenes pixeladas muy borrosas y renderizarlas con gran detalle. Según TechXplore, el modelo es capaz de tomar relativamente pocos píxeles y escalar las imágenes para crear caras realistas que tienen aproximadamente 64 veces la resolución de la imagen original. El modelo alucina, o imagina, rasgos que se encuentran entre las líneas de la imagen original.

La investigación es un ejemplo de súper resolución. Como Cynthia Rudin del equipo de informática de la Universidad de Duke explicado a TechXplore, este proyecto de investigación establece un récord de superresolución, ya que nunca antes se habían creado imágenes con tanta calidad a partir de una muestra tan pequeña de píxeles iniciales. Los investigadores tuvieron cuidado de enfatizar que el modelo en realidad no recrea el rostro de la persona en la imagen original de baja calidad. En cambio, genera nuevas caras, completando detalles que no estaban allí antes. Por esta razón, el modelo no podría usarse para sistemas de seguridad, ya que no podría convertir imágenes desenfocadas en imágenes de una persona real.

Las técnicas tradicionales de superresolución funcionan haciendo conjeturas sobre qué píxeles se necesitan para convertir la imagen en una imagen de alta resolución, basándose en imágenes que el modelo ha aprendido de antemano. Debido a que los píxeles agregados son el resultado de conjeturas, no todos los píxeles coincidirán con los píxeles circundantes y ciertas regiones de la imagen pueden verse borrosas o deformadas. Los investigadores de la Universidad de Duke utilizaron un método diferente para entrenar su modelo de IA. El modelo creado por los investigadores de Duke opera tomando primero imágenes de baja resolución y agregando detalles a la imagen con el tiempo, haciendo referencia a rostros generados por IA de alta resolución como ejemplos. El modelo hace referencia a las caras generadas por IA e intenta encontrar las que se asemejan a las imágenes de destino cuando las caras generadas se reducen al tamaño de la imagen de destino.

El equipo de investigación creó un modelo de Red Adversarial Generativa para manejar la creación de nuevas imágenes. Las GAN son en realidad dos redes neuronales que se entrenan en el mismo conjunto de datos y se enfrentan entre sí. Una red es responsable de generar imágenes falsas que imitan las imágenes reales en el conjunto de datos de entrenamiento, mientras que la segunda red es responsable de detectar las imágenes falsas de las genuinas. La primera red es notificada cuando sus imágenes han sido identificadas como falsas, y mejora hasta que las imágenes falsas sean indistinguibles de las imágenes genuinas.

Los investigadores han denominado a su modelo de superresolución LEGUMBRES, y el modelo produce constantemente imágenes de alta calidad, incluso si las imágenes son tan borrosas que otros métodos de superresolución no pueden crear imágenes de alta calidad a partir de ellas. El modelo incluso es capaz de hacer caras realistas a partir de imágenes en las que las características de la cara son casi indistinguibles. Por ejemplo, cuando se le da una imagen de una cara con una resolución de 16 × 16, puede crear una imagen de 1024 x 1024. Se agregan más de un millón de píxeles durante este proceso, rellenando detalles como mechones de cabello, arrugas e incluso iluminación. Cuando los investigadores hicieron que las personas calificaran las imágenes generadas por 1440 PULSE frente a las imágenes generadas por otras técnicas de superresolución, las imágenes generadas por PULSE consistentemente obtuvieron la mejor puntuación.

Si bien los investigadores usaron su modelo en imágenes de rostros de personas, las mismas técnicas que usan podrían aplicarse a casi cualquier objeto. Las imágenes de baja resolución de varios objetos podrían usarse para crear imágenes de alta resolución de ese conjunto de objetos, abriendo posibles aplicaciones para una variedad de industrias y campos diferentes, desde microscopía, imágenes satelitales, educación, fabricación y medicina.

Deja un comentario