Ingenieros biomédicos en la Universidad de Duke han descubierto una forma de utilizar el aprendizaje automático para modelar las interacciones que tienen lugar entre variables complejas en bacterias modificadas. Tradicionalmente, este tipo de modelado ha sido demasiado difícil de completar, pero estos nuevos algoritmos se pueden usar dentro de múltiples tipos diferentes de sistemas biológicos.
La nueva investigación fue publicada en la revista Nature Communications el 25 de septiembre.
Los investigadores biomédicos observaron un circuito biológico que estaba incrustado en un cultivo bacteriano y pudieron predecir patrones circulares. Esta nueva forma de modelado fue extremadamente más rápida que los métodos tradicionales. Específicamente, fue 30.000 veces más rápido que el modelo computacional actual.
Para ser más precisos, los investigadores volvieron a entrenar el modelo de aprendizaje automático varias veces. Compararon las respuestas y las usaron en un segundo sistema biológico. El segundo sistema era computacionalmente diferente al primero, por lo que el algoritmo no estaba limitado a un conjunto de problemas.
Lingchong You es profesor de ingeniería biomédica en Duke.
“Este trabajo se inspiró en que Google mostró que las redes neuronales podrían aprender a vencer a un humano en el juego de mesa Go”. ella dijo.
“Aunque el juego tiene reglas simples, hay demasiadas posibilidades para que una computadora calcule la siguiente mejor opción de manera determinista”, dijo You. “Me preguntaba si tal enfoque podría ser útil para hacer frente a ciertos aspectos de la complejidad biológica a los que nos enfrentamos”.
El estudio utilizó 13 variables bacterianas diferentes, incluidas las tasas de crecimiento, difusión, degradación de proteínas y movimiento celular. Una sola computadora necesitaría al menos 600 años para calcular seis valores por parámetro, pero el nuevo sistema de aprendizaje automático puede completarlo en horas.
“El modelo que usamos es lento porque tiene que tener en cuenta pasos intermedios en el tiempo a un ritmo lo suficientemente pequeño para ser preciso”, dijo Lingchong You. “Pero no siempre nos preocupamos por los pasos intermedios. Solo queremos los resultados finales para ciertas aplicaciones. Y podemos (volver a) descubrir los pasos intermedios si encontramos interesantes los resultados finales”.
El asociado postdoctoral Shangying Wang utilizó una red neuronal profunda que puede hacer predicciones mucho más rápido que el modelo original. La red utiliza variables del modelo como entrada y asigna pesos y sesgos aleatorios. Luego, hace una predicción sobre el patrón que seguirá la colonia bacteriana.
El primer resultado no es correcto, pero la red cambia ligeramente los pesos y sesgos a medida que recibe nuevos datos de entrenamiento. Una vez que haya suficientes datos de entrenamiento, las predicciones serán más precisas y permanecerán así.
Se entrenaron cuatro redes neuronales diferentes y se compararon sus respuestas. Los investigadores descubrieron que cada vez que las redes neuronales hacen predicciones similares, estaban cerca de la respuesta correcta.
“Descubrimos que no teníamos que validar cada respuesta con el modelo computacional estándar más lento”, dijo You. «En su lugar, utilizamos esencialmente la ‘sabiduría de la multitud'».
Después de entrenar suficientemente el modelo de aprendizaje automático, los investigadores biomédicos lo utilizaron en un circuito biológico. Se utilizaron 100.000 simulaciones de datos para entrenar la red neuronal. De todos ellos, solo uno produjo una colonia bacteriana con tres anillos, pero también pudieron identificar ciertas variables que eran importantes.
“La red neuronal fue capaz de encontrar patrones e interacciones entre las variables que de otro modo habrían sido imposibles de descubrir”, dijo Wang.
Para cerrar el estudio, los investigadores lo probaron en un sistema biológico que funciona al azar. Tradicionalmente, tendrían que usar un modelo de computadora que repite ciertos parámetros varias veces hasta que identifica el resultado más probable. El nuevo sistema también pudo hacer esto y demostró que se puede aplicar a varios sistemas biológicos complejos diferentes.
Los investigadores biomédicos ahora han recurrido a sistemas biológicos más complejos y están trabajando en el desarrollo del algoritmo para que sea aún más eficiente.
“Entrenamos la red neuronal con 100 000 conjuntos de datos, pero eso podría haber sido excesivo”, dijo Wang. “Estamos desarrollando un algoritmo en el que la red neuronal puede interactuar con simulaciones en tiempo real para ayudar a acelerar las cosas”.
“Nuestro primer objetivo era un sistema relativamente simple”, dijo You. “Ahora queremos mejorar estos sistemas de redes neuronales para proporcionar una ventana a la dinámica subyacente de circuitos biológicos más complejos”.