Un equipo de investigadores de la Escuela Pritzker de Ingeniería Molecular (PME) de la Universidad de Chicago logró recientemente la creación de un sistema de inteligencia artificial que puede crear proteínas artificiales completamente nuevas mediante el análisis de grandes cantidades de datos.
Las proteínas son macromoléculas esenciales para la construcción de tejidos en los seres vivos y críticas para la vida de las células en general. Las células utilizan las proteínas como catalizadores químicos para que se produzcan diversas reacciones químicas y para llevar a cabo tareas complejas. Si los científicos pueden descubrir cómo diseñar proteínas artificiales de manera confiable, podría abrir la puerta a nuevas formas de capturar carbono, nuevos métodos de recolección de energía y nuevos tratamientos para enfermedades. Las proteínas artificiales tienen el poder de alterar drásticamente el mundo en el que vivimos. Según informa EurekaAlert, un avance reciente de investigadores de la Universidad PME de Chicago ha acercado a los científicos a esos objetivos. Los investigadores de PME utilizaron algoritmos de aprendizaje automático para desarrollar un sistema capaz de generar nuevas formas de proteína.
El equipo de investigación creó modelos de aprendizaje automático entrenados con datos extraídos de varias bases de datos genómicas. A medida que los modelos aprendieron, comenzaron a distinguir patrones subyacentes comunes, reglas simples de diseño que permiten la creación de proteínas artificiales. Al tomar los patrones y sintetizar las respectivas proteínas en el laboratorio, los investigadores descubrieron que las proteínas artificiales creaban reacciones químicas que eran aproximadamente tan efectivas como las impulsadas por las proteínas naturales.
Según el profesor Joseph Regenstein en PME UC, Rama Ranganathan, el equipo de investigación descubrió que los datos del genoma contienen una gran cantidad de información sobre las funciones y estructuras básicas de las proteínas. Al utilizar el aprendizaje automático para reconocer estas estructuras comunes, los investigadores pudieron «embotellar las reglas de la naturaleza para crear proteínas nosotros mismos».
Los investigadores se centraron en las enzimas metabólicas para este estudio, específicamente en una familia de proteínas llamadas corismato mutasa. Esta familia de proteínas es necesaria para la vida en una amplia variedad de plantas, hongos y bacterias.
Ranganathan y sus colaboradores se dieron cuenta de que las bases de datos del genoma contenían conocimientos que esperaban ser descubiertos por los científicos, pero que los métodos tradicionales para determinar las reglas con respecto a la estructura y función de las proteínas solo han tenido un éxito limitado. El equipo se propuso diseñar modelos de aprendizaje automático capaces de revelar estas reglas de diseño. Los hallazgos del modelo implican que se pueden crear nuevas secuencias artificiales conservando las posiciones y correlaciones de los aminoácidos en la evolución de los pares de aminoácidos.
El equipo de investigadores creó genes sintéticos que codificaban secuencias de aminoácidos que producían estas proteínas. Clonaron bacterias con estos genes sintéticos y descubrieron que las bacterias usaban las proteínas sintéticas en su maquinaria celular, funcionando casi exactamente igual que las proteínas normales.
Según Ranganathan, las reglas simples que distinguió su IA pueden usarse para crear proteínas artificiales de increíble complejidad y variedad. Como explicó Ranganathan a EurekaAlert:
“Las limitaciones son mucho más pequeñas de lo que jamás imaginamos que serían. Hay una simplicidad en las reglas de diseño de la naturaleza, y creemos que enfoques similares podrían ayudarnos a buscar modelos para el diseño en otros sistemas complejos en biología, como los ecosistemas o el cerebro”.
Ranganathan y sus colaboradores quieren tomar sus modelos y generalizarlos, creando una plataforma que los científicos puedan usar para comprender mejor cómo se construyen las proteínas y qué efectos tienen. Esperan utilizar sus sistemas de IA para permitir que otros científicos descubran proteínas que puedan abordar problemas importantes como el cambio climático. Ranganathan y el profesor asociado Andrew Ferguson crearon una empresa denominada Evozyne, cuyo objetivo es comercializar la tecnología y promover su uso en campos como la agricultura, la energía y el medio ambiente.
Comprender los puntos en común entre las proteínas y las relaciones entre la estructura y la función también podría ayudar en la creación de nuevos medicamentos y formas de terapia. Aunque el plegamiento de proteínas se ha considerado durante mucho tiempo un problema increíblemente difícil de descifrar para las computadoras, los conocimientos de modelos como el producido una vez por el equipo de Ranganathan podrían ayudar a aumentar la velocidad a la que se producen estos cálculos, facilitando la creación de nuevos medicamentos basados en estas proteínas. Podrían desarrollarse fármacos que bloqueen la creación de proteínas dentro de los virus, potencialmente ayudando en el tratamiento incluso de virus nuevos como el coronavirus Covid-19.
Ranganathan y el resto del equipo de investigación aún necesitan comprender cómo y por qué funcionan sus modelos y cómo producen planos de proteínas confiables. El próximo objetivo del equipo de investigación es comprender mejor qué atributos tienen en cuenta los modelos para llegar a sus conclusiones.