Cuando se trata de investigación biomédica, se publican cientos de artículos de investigación todos los días. Sin embargo, puede ser difícil predecir qué investigación saldrá del entorno de laboratorio y conducirá a aplicaciones clínicas. Recientemente, un modelo de aprendizaje automático desarrollado por la Oficina de Análisis de Cartera, u OPA, de los Institutos Nacionales de Salud (NIH) pudo determinar la probabilidad de que un caso de investigación biomédica se utilice en ensayos clínicos o directrices. Según la OPA, la cita de un artículo de investigación en un ensayo clínico es un indicador temprano del progreso traslacional o el uso de los resultados de la investigación como un posible tratamiento para la enfermedad.
Según lo informado por AI Trends, los investigadores de la OPA crearon una nueva métrica para usar en su modelo de aprendizaje automático, denominado potencial aproximado para traducir, o APTO. Según el director de la OPA, George Santangelo, la traducción biomédica se puede predecir en función de la reacción de la comunidad científica a los trabajos de investigación en los que se basa un proyecto. Santangelo dijo que existen distintas trayectorias para el flujo de conocimiento que pueden predecir la tasa de éxito o fracaso de un artículo que influye en la investigación clínica.
La creación de la métrica APT coincide con el lanzamiento de la segunda versión de la herramienta iCite del NIH. iCite es una aplicación basada en navegador que proporciona información sobre publicaciones de revistas según su campo específico de análisis. En el futuro, la herramienta iCite devolverá los valores APT para las consultas.
El proceso de adaptar la investigación de laboratorio a las aplicaciones clínicas es una tarea compleja que a menudo lleva años. Se han hecho intentos para acelerar este proceso, debido a las muchas variables involucradas en la tarea, puede ser difícil evaluar el proceso de traducción. Como explica Santangelo, los algoritmos de aprendizaje automático son una herramienta poderosa que podría
Permitir a los médicos comprender mejor qué trabajos de investigación pueden resultar útiles en la clínica. A medida que el equipo de investigadores experimentó y perfeccionó su métrica APT, comenzaron a materializarse patrones predictivos útiles.
“Creo que el más importante en el que nos enfocamos es la diversidad de intereses desde el eje fundamental hasta la investigación clínica. Cuando las personas en ese eje, desde científicos fundamentales, a menudo en el mismo campo que el trabajo que se publica, hasta personas en la clínica, muestran interés en la forma de citas en esos artículos, entonces la probabilidad de una cita final por parte de un ensayo clínico o directriz es bastante alta”.
Según Santangelo, las características seleccionadas muestran una verdadera promesa en la predicción de la traducción de un trabajo de investigación a un método clínico. Los datos sobre una publicación recopilados durante al menos dos años a partir de la fecha de publicación a menudo brindan predicciones precisas sobre la eventual cita de un artículo en un artículo clínico.
Santangelo explicó que gracias a los nuevos algoritmos métricos y de aprendizaje automático, los investigadores pueden tener un conocimiento más completo de lo que está sucediendo en la literatura y que esto permite una mejor comprensión de las áreas de investigación que tienen más probabilidades de atraer a los científicos clínicos.
Santangelo también explicó que la integración de sus algoritmos en la herramienta iCite tiene como objetivo aprovechar la naturaleza abierta y gratuita de la base de datos Open Citation Collection de los NIH.
La base de datos NIH Open Citation Collection está actualmente compuesta por más de 420 millones de enlaces de citas y sigue creciendo. El algoritmo del equipo de Santangelo presentará los valores APT para estas citas cuando iCite 2.0 se lance en el futuro.
Muchas bases de datos son restrictivas y apropiadas y, según Santangelo, estas barreras inhiben la investigación colaborativa. Santangelo opina que no hay una justificación fantástica para mantener los datos detrás de un muro de pago y que debido a que se supone que su algoritmo permite que otros vean los valores APT calculados, no sería beneficioso usar fuentes de datos patentadas.