Por Eric PaternósterCEO de Servicios Públicos de Infosys
Hasta ahora, los modelos de ciencia de datos existentes no han hecho el mejor trabajo para predecir la facilidad de transmisión de COVID-19, el alcance de su desarrollo y los brotes en nuevos puntos críticos. Muchos se desarrollaron a toda prisa, con información limitada.
Sin embargo, un modelo de IA sería adaptable, construido a escala y automatizado, procesando datos sociológicos, económicos y de salud relacionados con COVID para permitir que las economías se reabrieran con éxito en caso de que ocurriera otra ola.
Los datos utilizados en este modelo deben ser precisos y estadísticamente significativos. También debe ser confiable. Hasta ahora, cosas como los valores R, los niveles de inmunidad colectiva y las tasas de mortalidad han sido muy difíciles de estimar en todas las geografías, especialmente en lugares sin una estrategia coherente de rastreo de contactos y pruebas. Otro problema ha sido que, incluso cuando se han realizado buenas pruebas, ha habido grandes diferencias en las tasas de sensibilidad y especificidad, provocadas por la variación en los tipos de pruebas de inmunodiagnóstico y las técnicas de recolección de muestras.
No solo los datos son deslucidos, sino que los propios modelos tienen fallas. El modelo utilizado por la Casa Blanca, construido por el Instituto para la Métrica y Evaluación de la Salud, no tuvo en cuenta las diferencias en los parámetros regionales clave y asumió que el virus afectaría a la población de la misma manera que lo hizo en China, España e Italia. . Por supuesto, EE. UU. tiene características de población, niveles de cuarentena y disponibilidad de pruebas muy diferentes.
Otros modelos, a menudo desarrollados por universidades líderes de todo el mundo, lo hicieron un poco mejor. Incorporaron estimaciones de contagio, junto con factores que aumentan el riesgo de enfermedad grave o muerte. Pero incluso estos se basaron en suposiciones inexactas, lo que llevó a errores en el modelo de trabajo. Por ejemplo, el modelo desarrollado inicialmente por el Imperial College London no logró inferir el cambio obvio en el comportamiento de la población que aún surgiría en ausencia de intervenciones ordenadas por el gobierno. También carecía de comprensión sobre cómo cambiaría el número de reproducción del virus (R0) debido a este comportamiento.
No es de extrañar entonces que haya resultado tanta confusión, especialmente en los EE. UU. y el Reino Unido. Facilitar los controles sin preparación para las consecuencias ha sido costoso, incluso cuando es probable que la enfermedad regrese. Se deben tomar medidas ahora para informar la toma de decisiones a un nivel más granular. Las poblaciones deben estratificarse para determinar quién sale primero del confinamiento. Se debe implementar una estrategia para permitir el rastreo de contactos a escala y garantizar que la atención médica sea suficiente en el futuro.
Para ayudar en esto, se deben usar redes neuronales artificiales y técnicas de aprendizaje profundo, aumentando los modelos epidemiológicos existentes y haciéndolos más dinámicos y receptivos en tiempo real. Este modelo de IA usaría aprendizaje semisupervisado o no supervisado y podría funcionar incluso con información limitada de informes de pruebas a gran escala. Sería autosuficiente y requeriría una cantidad reducida de datos para aprender y predecir, en comparación con los modelos actuales. Mediante el ajuste continuo de los parámetros de entrada y el aprendizaje continuo, el modelo generaría predicciones que no sufrirían los inevitables retrasos de ajuste.
Con el aprendizaje profundo, la IA podría descubrir patrones complejos, autoaprender y autocurarse automáticamente. Puede detectar anomalías automáticamente y también podría juzgar la precisión de las variables, produciendo resultados mucho más confiables que los modelos de ciencia de datos COVID existentes.
Los parámetros clave en este modelo de IA se basarían en informes de pruebas clínicas, datos de rastreo de contactos y grandes conjuntos de datos regionales, e incluirían características de la población regional, estado socioeconómico y factores de riesgo como el tabaquismo, la dependencia de drogas y la obesidad. La cantidad de personas infectadas que se pusieron en cuarentena y ya no pudieron propagar la infección se incorporaría al modelo.
Esto les daría a los líderes del grupo de trabajo los conocimientos necesarios para detener esta peligrosa enfermedad de manera proactiva, permitiéndoles tomar decisiones racionales casi en tiempo real, brindando a las economías mundiales una estrategia de salida sólida y bien informada.