Investigadores y científicos de la División de Energía Sostenible e Ingeniería Ambiental de la Universidad de Osaka pudieron eliminar digitalmente las nubes de las imágenes aéreas mediante el uso de redes antagónicas generativas (GAN). Con los datos resultantes, podrían generar automáticamente conjuntos de datos precisos para construir máscaras de imágenes.
La investigación fue publicada en Ingeniería Informática Avanzada.
El equipo puso dos redes de inteligencia artificial (IA) una contra la otra para mejorar la calidad de los datos, y no requirió imágenes previamente etiquetadas. Según el equipo, estos nuevos desarrollos podrían usarse en campos como la ingeniería civil, donde la tecnología de visión artificial es importante.
Aprendizaje automático para reparar imágenes
El aprendizaje automático se usa a menudo para reparar imágenes oscurecidas, como imágenes aéreas de edificios oscurecidos por nubes. Esta tarea se puede realizar manualmente, pero requiere mucho tiempo y no es tan efectiva como los algoritmos de aprendizaje automático. Incluso los algoritmos que ya están disponibles requieren un gran conjunto de imágenes de entrenamiento, por lo que es crucial avanzar más en la tecnología.
Esto es lo que hicieron los investigadores de la Universidad de Osaka cuando aplicaron redes adversarias generativas. Una red es la “red generativa”, y propone imágenes reconstruidas sin nubes. Esta red se compara con una “red discriminatoria”, que se basa en una red neuronal convolucional para distinguir entre las imágenes reparadas digitalmente y las imágenes reales sin nubes.
A medida que las redes avanzan en este proceso, ambas mejoran cada vez más, lo que les permite crear imágenes muy realistas con las nubes borradas digitalmente.
Kazunosuke Ikeno es el primer autor del artículo.
“Al entrenar la red generativa para ‘engañar’ a la red discriminatoria para que piense que una imagen es real, obtenemos imágenes reconstruidas que son más consistentes”, dice Ikeno.
Imagen: 2021 Kazunosuke IKENO et al., Informática de ingeniería avanzada
Entrenamiento del sistema
El equipo se basó en modelos virtuales 3D con fotografías de un conjunto de datos de código abierto, y esto se utilizó como entrada. Esto permitió que el sistema generara automáticamente “máscaras” digitales que superpusieron edificios reconstruidos sobre la nube.
Tomohiro Fukuda es el autor principal de la investigación.
“Este método permite detectar edificios en áreas sin datos de entrenamiento etiquetados”, dice Fukuda.
El modelo entrenado pudo detectar edificios con un valor de “intersección sobre unión” de 0,651. Este valor es la medida de la precisión con la que el área reconstruida corresponde al área real.
Según el equipo, este método puede mejorar la calidad de otros conjuntos de datos con imágenes oscurecidas, solo necesita ser ampliado. Esto puede incluir imágenes en varios campos, como la atención médica, donde podría usarse para mejorar las imágenes médicas.