Por primera vez, se está utilizando una Red Adversaria Generativa para crear conjuntos de datos sintéticos de imágenes de heridas, con el fin de corregir la falta crítica de contenido diverso y accesible de este tipo en las aplicaciones de aprendizaje automático de atención médica.
El sistema, llamado WG2ANes una colaboración entre Batten College of Engineering & Technology y la empresa de salud de IA eKare, que se especializa en aplicar metodologías de aprendizaje automático para la medición e identificación de heridas.
El GAN está capacitado en 100-4000 imágenes estereoscópicas etiquetadas de heridas crónicas proporcionadas por eKare, incluidas imágenes anónimas de tipos de lesiones por causas como presión, cirugía, incidentes linfovasculares, diabetes y lesiones por quemaduras. El material de origen varió en tamaño entre 1224 × 1224 y 2160 × 2160, todo tomado bajo la luz disponible por los médicos.
Para acomodar el espacio latente disponible en la arquitectura de entrenamiento del modelo, las imágenes se redimensionaron a 512 × 512 y se extrajeron de sus fondos. Para estudiar el efecto del tamaño del conjunto de datos, se implementaron pruebas en lotes de 100, 250, 500, 1000, 2000 y 4000 imágenes.
Fuente: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
La imagen de arriba muestra detalles y granularidad crecientes según el tamaño del conjunto de entrenamiento contribuyente y el número de épocas ejecutar en cada pasada.
La arquitectura de WG2GAN. Fuente: https://ietresearch.onlinelibrary.wiley.com/doi/pdfdirect/10.1049/tje2.12033
WG2GAN se ejecuta en PyTorch en una configuración de estilo de consumidor relativamente sencilla, con 8 GB de VRAM en una GPU GTX 1080. La capacitación tomó entre 4 y 58 horas en el rango de tamaños de conjuntos de datos de 100 a 4000 imágenes y en un rango de épocas, en un tamaño de lote de 64 como compensación entre precisión y rendimiento. Adam Optimizer se utiliza durante la primera mitad del entrenamiento a una tasa de aprendizaje de 0,0002 y concluye con una tasa de aprendizaje decreciente lineal hasta que se logra una pérdida de cero.
Arriba a la izquierda, segmentación aplicada al área de la herida. Arriba centro, imagen de la herida real; arriba a la derecha, una herida sintética de un tipo que se puede generalizar en un conjunto de datos, según la fuente original. Abajo, la herida original y, a la derecha, una síntesis de la herida generada por WG2GAN.
En los conjuntos de datos médicos, como en tantos otros sectores del aprendizaje automático, el etiquetado es un cuello de botella inevitable. En este caso, los investigadores utilizaron un sistema de etiquetado semiautomático que aprovecha investigaciones anteriores de eKare, que empleó modelos de heridas del mundo real, creados en Play-Doh y coloreados toscamente para el contexto semántico.
Modelos de heridas eKare
Los investigadores notaron un problema que ocurre con frecuencia en las etapas iniciales del entrenamiento, cuando un conjunto de datos es bastante diverso y los pesos son aleatorios: el modelo tarda mucho tiempo (75 épocas) en ‘establecerse’:
Cuando los datos son variados, tanto los modelos de GAN como los de codificador/descodificador luchan por generalizarse en las primeras etapas, como podemos ver en el gráfico anterior del entrenamiento de WG2GAN, que rastrea la línea de tiempo del entrenamiento desde el inicio hasta la pérdida cero.
Se debe tener cuidado para garantizar que el proceso de entrenamiento no se fije en las funciones o características de ninguna iteración o época, sino que continúe generalizándose a una pérdida media utilizable sin producir resultados que abstraigan excesivamente el material de origen. En el caso de WG2GAN, eso correría el riesgo de crear heridas ilimitadas, completamente «ficticias», concatenadas entre una gama demasiado amplia de tipos de heridas no relacionadas, en lugar de producir una gama precisa de variaciones dentro de un tipo de herida en particular.
Alcance de control en un conjunto de datos de aprendizaje automático
Los modelos con conjuntos de entrenamiento más ligeros generalizan más rápido, y los investigadores del artículo sostienen que las imágenes más realistas podrían obtenerse con una configuración inferior a la máxima: un conjunto de datos de 1000 imágenes entrenado en 200 épocas.
Aunque los conjuntos de datos más pequeños pueden lograr imágenes muy realistas en menos tiempo, el rango de imágenes y los tipos de heridas generados también serán necesariamente más limitados. Hay un delicado equilibrio en los regímenes de entrenamiento de GAN y codificador/descodificador entre el volumen y la variedad de datos de entrada, la fidelidad de las imágenes producidas y el realismo de las imágenes producidas: problemas de alcance y ponderación que ciertamente no se limitan a la imagen médica. síntesis.
Desequilibrios de clase en conjuntos de datos médicos
En general, el aprendizaje automático de la atención de la salud se ve acosado no solo por una falta de conjuntos de datospero por desequilibrios de clasedonde los datos esenciales sobre una enfermedad específica constituyen un porcentaje tan pequeño de su conjunto de datos anfitriones que corren el riesgo de ser descartados como datos atípicos o de ser asimilados en el proceso de generalización a lo largo del entrenamiento.
Se han propuesto varios métodos para abordar este último problema, como submuestreo o sobremuestreo. Sin embargo, el problema con frecuencia se elude mediante el desarrollo de conjuntos de datos específicos de enfermedades que están completamente vinculados a un solo problema médico. Aunque este enfoque es efectivo caso por caso, contribuye a la cultura de balcanización en el ámbito de la investigación médica de aprendizaje automático, y podría decirse que ralentiza el progreso general en el sector.