Algoritmo de IA lee y predice datos de pacientes a partir de registros médicos electrónicos

Los científicos de la Escuela de Medicina Icahn en Mount Sinai han desarrollado un nuevo algoritmo automatizado basado en inteligencia artificial (IA) que puede leer y predecir datos de pacientes a partir de registros de salud electrónicos (EHR).

El nuevo método se llama Phe2vec y puede identificar con precisión a pacientes con ciertas enfermedades. Se demostró que es tan preciso como el método tradicional más popular, que requiere más trabajo manual para realizarlo.

Benjamin S. Glicksberg, PhD, es Profesor Asistente de Genética y Ciencias Genómicas. También es miembro del Instituto Hasso Plattner para la Salud Digital en Mount Sinai (HPIMS) y autor principal del estudio.

“Sigue habiendo una explosión en la cantidad y los tipos de datos almacenados electrónicamente en la historia clínica de un paciente. Desentrañar esta compleja red de datos puede ser muy oneroso, lo que ralentiza los avances en la investigación clínica”, dijo Glicksberg. “En este estudio, creamos un nuevo método para extraer datos de registros médicos electrónicos con aprendizaje automático que es más rápido y requiere menos mano de obra que el estándar de la industria. Esperamos que esta sea una herramienta valiosa que facilite una mayor investigación y menos sesgada en informática clínica”.

El estudio, que fue publicado en la revista Patronesfue dirigido por Jessica K. De Freitas, estudiante de posgrado en el laboratorio del Dr. Glicksberg.

Estándar actual de la industria

Actualmente, los científicos confían en algoritmos y programas informáticos establecidos para extraer registros médicos en busca de nueva información. Un sistema llamado Phenotype Knowledgebase (PheKB) desarrolla y almacena estos algoritmos. El sistema es muy efectivo para identificar correctamente el diagnóstico de un paciente, pero los investigadores deben revisar muchos registros médicos y buscar primero datos. Estos datos incluyen cosas como pruebas de laboratorio y recetas.

Luego, el algoritmo se programa para guiar a la computadora en la búsqueda de pacientes que tienen datos específicos de la enfermedad, que se etiquetan como “fenotipo”. Esto permite que el sistema cree una lista de pacientes, que luego los investigadores deben verificar manualmente. Si los investigadores quieren estudiar una nueva enfermedad, deben comenzar el proceso de nuevo.

El nuevo método

Con el nuevo método, los investigadores permiten que la computadora aprenda por sí misma cómo detectar fenotipos de enfermedades, lo que ahorra tiempo y trabajo a los investigadores. El método Phe2vec se basó en estudios previos realizados por el equipo.

Riccardo Miotto, PhD, es ex profesor asistente en HPIMS y autor principal del estudio.

“Anteriormente, demostramos que el aprendizaje automático no supervisado podría ser una estrategia altamente eficiente y efectiva para extraer registros médicos electrónicos”, dijo Miotto. “La ventaja potencial de nuestro enfoque es que aprende representaciones de enfermedades a partir de los propios datos. Por lo tanto, la máquina hace gran parte del trabajo que normalmente harían los expertos para definir la combinación de elementos de datos de los registros de salud que mejor describen una enfermedad en particular”.

La computadora fue programada para revisar millones de registros de salud electrónicos y aprender a identificar conexiones entre datos y enfermedades. La programación se basó en algoritmos de “incrustación”, que también fueron desarrollados previamente por los investigadores. Estos se utilizaron para estudiar redes de palabras en varios idiomas.

Uno de esos algoritmos se llamaba word2vec y era especialmente efectivo. Luego, la computadora se programó para identificar el diagnóstico de alrededor de 2 millones de pacientes cuyos datos se almacenaron en el Sistema de Salud Mount Sinai.

Luego, los investigadores compararon la efectividad de los sistemas nuevos y antiguos, y encontraron que para nueve de cada diez enfermedades probadas, el nuevo sistema Phe2vec fue tan efectivo, o ligeramente mejor, que el actual proceso de fenotipado “estándar de oro” para identificar el diagnóstico. de los EHR. Estas enfermedades pueden incluir demencia, esclerosis múltiple, anemia de células falciformes y más.

“En general, nuestros resultados son alentadores y sugieren que Phe2vec es una técnica prometedora para el fenotipado a gran escala de enfermedades en datos de registros de salud electrónicos”, dijo el Dr. Glicksberg. “Con más pruebas y refinamientos, esperamos que pueda usarse para automatizar muchos de los pasos iniciales de la investigación en informática clínica, lo que permitirá a los científicos centrar sus esfuerzos en análisis posteriores como el modelado predictivo”.

Deja un comentario