Por qué la Industria 5.0 necesita Inteligencia General Artificial

Por: Bas Steunebrink, cofundador y director de Inteligencia General Artificial, Eric Nivel, ingeniero principal de AGI y Jerry Swan, científico investigador de NAISENSE.

Damos por sentado la automatización en nuestro mundo moderno, beneficiándonos cada día de las cadenas de suministro que se extienden por todo el mundo, entregando una amplia selección de productos a nuestros estantes. Pero detrás de escena, la producción y el movimiento de bienes generan muchos desafíos de optimización, como el empaque, la programación, el enrutamiento y la automatización de la línea de ensamblaje. Estos desafíos de optimización son dinámicos y cambian constantemente junto con el mundo real. Por ejemplo, las rutas de suministro esperadas pueden verse comprometidas repentinamente debido a circunstancias imprevistas; por ejemplo, el Canal de Suez puede estar bloqueado; las rutas aéreas pueden cambiar debido a erupciones volcánicas; países enteros pueden ser inaccesibles debido al conflicto. Los cambios en la legislación, el colapso de la moneda y la escasez de recursos también son ejemplos de variables del lado de la oferta en constante cambio.

Para proporcionar otro ejemplo, a veces se debe incorporar un componente novedoso a una máquina o flujo de trabajo (los usuarios pueden querer diferentes materiales o colores, por ejemplo). Actualmente, se requiere mano de obra humana experta para realizar cambios en el sistema o, en el caso del aprendizaje automático, para volver a capacitar y volver a implementar la solución. De manera similar, los «gemelos digitales» de Industry 4.0 todavía dependen en gran medida de la noción de que la descripción del problema y la distribución de entradas se pueden especificar de una vez por todas en el punto de diseño inicial del sistema.

La pandemia reciente destaca la fragilidad de la planificación de la cadena de suministro «justo a tiempo». Se hace más evidente que, en un mundo cada vez más complejo e incierto, la industria ya no puede permitirse tanta inflexibilidad. En la actualidad, la fabricación tiene que hacer una elección fija entre «Low-Mix High-Volume» (LMHV) y «High-Mix Low-Volume» (HMLV). Industry 5.0 anticipa la perspectiva de «High-Mix High-Volume» (HMHV), en el que el flujo de trabajo se puede reconfigurar a bajo costo para cumplir con los requisitos de fluidos. Para lograr esto, se requiere “automatizar la automatización”, a fin de eliminar la necesidad de intervención humana y/o el tiempo de inactividad del sistema cuando cambia el problema o el entorno. Esto requiere sistemas que «trabajen a la orden», reaccionando a tales cambios, mientras que aún tienen una perspectiva razonable de completar sus tareas asignadas dentro de las limitaciones de tiempo del mundo real. Considere, como ejemplo, instruir a un robot de línea de ensamblaje, actualmente ocupado con la tarea X, de la siguiente manera:

“Deje de ensamblar X inmediatamente: aquí hay una especificación de Y, y aquí están la mayoría de sus efectores antiguos y algunos nuevos. Ahora comience a ensamblar Y, evitando tales y tales tipos de defectos y desperdicios”.

A pesar de las recientes conversaciones generalizadas sobre la llegada inminente de la «Inteligencia General Artificial» (AGI) a través de los llamados Modelos de Lenguaje Grande como GPT-3, ninguno de los enfoques propuestos es realmente capaz de «trabajar bajo comando». Es decir, no se les puede asignar algo completamente fuera de su conjunto de entrenamiento sin el tiempo de inactividad del reentrenamiento, la verificación y la redistribución fuera de línea.

Seguramente está claro que cualquier noción de inteligencia del mundo real está inextricablemente asociada con la capacidad de respuesta al cambio. Un sistema que permanece sin cambios, sin importar a cuántos eventos inesperados esté expuesto, no es autónomo ni inteligente. Esto no es para restar valor a las indudables fortalezas de estos enfoques de aprendizaje profundo (DL), que han tenido un gran éxito como medio para sintetizar programas para problemas que son difíciles de especificar explícitamente.

Entonces, ¿qué tipo de funcionalidad del sistema podría permitir que la IA vaya más allá de este paradigma de entrenar, congelar e implementar, hacia uno que sea capaz de un aprendizaje adaptativo ininterrumpido? Considere la necesidad de reemplazar un componente defectuoso en un flujo de trabajo de fabricación con uno de un proveedor diferente, que podría tener diferentes tolerancias. Con el modelado de caja negra de extremo a extremo de la IA contemporánea, el proceso de hermanamiento digital debe realizarse de nuevo. Para abordar las limitaciones de los enfoques contemporáneos, se requiere un cambio radical: un modelo que pueda razonar directamente sobre las consecuencias de un cambio de componente y, de hecho, escenarios contrafactuales más generales de «qué pasaría si». Descomponer un flujo de trabajo en componentes con propiedades conocidas y volver a combinarlos según sea necesario requiere lo que se conoce como «composicionalidad».

La composicionalidad ha eludido hasta ahora la IA contemporánea, donde a menudo se confunde con la noción más débil de modularidad. La modularidad tiene que ver con la capacidad de «pegar» componentes, pero esto no logra capturar la esencia de la composicionalidad, que es la capacidad de razonar sobre el comportamiento del flujo de trabajo resultante para determinar y asegurar la preservación de alguna propiedad deseada. Esta capacidad es vital por razones de verificación y seguridad: por ejemplo, la capacidad del sistema para razonar que «adoptar un motor de un fabricante alternativo aumentará la potencia de salida general de la planta mientras todos sus demás componentes se mantienen dentro de los márgenes de temperatura».

Aunque los enfoques de redes neuronales contemporáneos sobresalen en el aprendizaje de reglas a partir de datos, carecen de razonamiento composicional. Como alternativa a la esperanza de que el razonamiento composicional surja de las arquitecturas de redes neuronales, es posible hacer uso directo de las construcciones de la teoría de categorías, el estudio matemático de la composicionalidad. En particular, su subcampo categórico cibernético se ocupa de los controladores bidireccionales como elementos de representación fundamentales. La bidireccionalidad es la capacidad de realizar inferencias directas e inversas: hacer predicciones de causas a efectos y viceversa. La inferencia inversa composicional es particularmente importante porque permite la incorporación de retroalimentación del entorno en cualquier escala de representación estructural, lo que facilita el aprendizaje rápido a partir de una pequeña cantidad de ejemplos.

Dado algún comportamiento deseado del sistema, la tarea de aprendizaje es entonces construir una estructura de control agregado que lo satisfaga. Las estructuras aprendidas inicialmente actúan como un esqueleto para el aprendizaje posterior.

A medida que aumenta el conocimiento del sistema, este esqueleto se puede decorar con propiedades de composición aprendidas, de manera similar a cómo se puede determinar que una molécula de H2O tiene propiedades diferentes a las de sus átomos constituyentes. Además, así como “lanzar una pelota” y “balancear una raqueta de tenis” pueden verse como acciones musculoesqueléticas relacionadas para un ser humano, las tareas relacionadas pueden compartir una estructura de controlador esquelético que se embellece de manera específica para la tarea a través de la retroalimentación del usuario. ambiente. Este desacoplamiento de la estructura causal de las tareas específicas puede facilitar el aprendizaje de nuevas tareas sin el olvido catastrófico que afecta a los enfoques contemporáneos. Por lo tanto, un enfoque híbrido numérico-simbólico de la forma descrita anteriormente puede combinar las fortalezas de los enfoques neural y simbólico, al tener una noción explícita de estructura y la capacidad de aprender adaptativamente cómo se componen las propiedades. El razonamiento sobre las propiedades de composición se basa de manera continua en el trabajo que se le ordena realizar al sistema actualmente.

En conclusión, está claro que se requiere un nuevo enfoque para crear sistemas verdaderamente autónomos: sistemas capaces de adaptarse a cambios significativos y/u operar en entornos desconocidos. Esto requiere un aprendizaje adaptativo ininterrumpido y generalizar a partir de lo que ya se sabe. A pesar de su nombre, los enfoques de aprendizaje profundo tienen solo una representación superficial del mundo que no puede ser manipulada a un alto nivel por el proceso de aprendizaje. Por el contrario, proponemos que los sistemas AGI que surjan en la próxima generación incorporarán el aprendizaje profundo dentro de una arquitectura más amplia, equipada con la capacidad de razonar directamente sobre lo que sabe.

La capacidad de un sistema para razonar simbólicamente sobre su propia representación confiere beneficios significativos para la industria: con una representación explícitamente compositiva, el sistema puede ser auditado, ya sea por humanos o internamente por el propio sistema, para cumplir con los requisitos vitales de seguridad y equidad. Si bien ha habido mucha preocupación académica acerca de los llamados riesgo x de AGI, el enfoque apropiado es más bien el problema de ingeniería concreto de reasignar un sistema de control manteniendo estos requisitos vitales, un proceso que denominamos alineación interactiva. Solo a través de la adopción de este tipo de sistemas de control, que son aprendices continuos confiables y eficientes, podremos realizar la próxima generación de autonomía prevista por Industry 5.0.

Deja un comentario