Francisco Webber, cofundador y director ejecutivo de Cortical.io – Serie de entrevistas

Francisco Webber es co-fundador y CEO de Cortical.io e inventor de la tecnología Retina propiedad de la empresa. Esta tecnología aplica los principios del procesamiento cerebral al aprendizaje automático y la comprensión del lenguaje natural (NLU) para resolver casos de uso del mundo real relacionados con grandes datos de texto. Las soluciones de Cortical.io se basan en el significado real del texto, en lugar de ocurrencias estadísticas.

El interés de Francisco por la tecnología de la información se desarrolló durante sus estudios de medicina, cuando estaba involucrado en el procesamiento de datos médicos. A lo largo de dos décadas, exploró las tecnologías de los motores de búsqueda y los sistemas de documentación en varios contextos, pero se sintió cada vez más frustrado con las limitaciones de los métodos estadísticos más avanzados.

En 2005 fundó Matrixware Information Services, que desarrolló la primera base de datos de patentes global estandarizada. En 2007, creó el Centro de Recuperación de Información con el experto académico líder en recuperación de información, el profesor Keith van Rijsbergen. El Fondo tenía como objetivo cerrar la brecha entre la academia y la industria en el campo de la recuperación de información. Francisco reconoció que el cerebro era el único sistema de referencia existente a la hora de procesar el lenguaje natural. Mientras seguía de cerca los avances en neurociencia, formuló su teoría del plegamiento semántico, que modela cómo el cerebro representa los datos del lenguaje.

¿Qué te atrajo inicialmente para involucrarte en la comprensión del lenguaje natural (NLU)?

Mi interés en la tecnología de la información se desarrolló durante mis estudios de medicina, cuando estaba involucrado en el procesamiento de datos médicos. En el transcurso de dos décadas, exploré las tecnologías de los motores de búsqueda y los sistemas de documentación en varios contextos, pero me sentí cada vez más frustrado con las limitaciones de los métodos estadísticos más avanzados. Reconocí que el cerebro era el único sistema de referencia existente a la hora de procesar el lenguaje natural.

Usted es el fundador y director general de Cortical.io. ¿Podría compartir la historia de génesis detrás de esta empresa?

Sabíamos que teníamos una tecnología que permitiría a las empresas realizar búsquedas de forma más rápida, precisa y eficaz para extraer, anotar y analizar información de texto no estructurado. Nuestra tecnología NLU basada en IA podría ser un diferenciador real al abordar el desafío de procesar datos de texto no estructurados, ya que comprende el significado de oraciones, párrafos y conceptos, no solo palabras clave y, en consecuencia, ofrece resultados muy precisos. A medida que los líderes de la industria se enteraron de lo que teníamos, nos abrió la puerta para probar nuestro enfoque bajo requisitos reales y complejos. Esto resultó en numerosos éxitos comerciales de Fortune 500. Estos se han convertido en los modelos para nuestros productos de inteligencia de mensajes y contratos.

La tecnología Cortical.io se basa en la Documento técnico sobre la teoría del plegamiento semántico (SFT), una innovadora teoría computacional para el procesamiento de datos de lenguaje. ¿Cuáles son algunas de las limitaciones actuales en la forma en que la mayoría de la IA aborda la NLU?

Los enfoques estándar de IA y ML implican la creación de modelos estadísticos a gran escala que se entrenan utilizando cantidades masivas de datos de entrenamiento. A menudo, no se dispone fácilmente de cantidades suficientes de datos de capacitación, ni los expertos en la materia tienen el tiempo para anotar cantidades tan grandes de documentos. Además, entrenar modelos grandes (con miles de millones de parámetros) requiere enormes recursos informáticos, lo cual es costoso y consume mucha energía. ¡Un modelo de idioma típico consume más energía que cinco automóviles durante toda su vida útil!

La teoría del plegamiento semántico se basa en la Teoría de la memoria temporal jerárquica (HTM). ¿Podría describir brevemente en qué consiste esta teoría?

La memoria temporal jerárquica (HTM) es una teoría de la inteligencia con restricciones biológicas descrita originalmente en el libro Sobre la inteligencia de Jeff Hawkins. Es un marco de inteligencia artificial basado estrictamente en la neurociencia y la fisiología e interacción de las neuronas en el cerebro. En esta teoría, el cerebro actúa como un sistema de memoria que almacena patrones y hace predicciones a partir de experiencias actuales basadas en patrones memorizados. Para ser verdaderamente inteligentes, las máquinas deben recrear este sistema de predicción de memoria. Hawkins describe las representaciones dispersas distribuidas como el único formato de datos utilizado por la neocorteza. Las huellas dactilares semánticas utilizadas en nuestra tecnología son representaciones escasamente distribuidas de texto (de palabras, oraciones o párrafos).

¿Podría compartir con nosotros cómo el método SFT es superior a las estrategias NLU de la competencia?

La teoría del plegamiento semántico que respalda la tecnología Cortical.io tiene varias ventajas importantes. En primer lugar, no requiere un gran depósito de datos de muestra y ofrece resultados precisos. En segundo lugar, es rápido y requiere menos recursos informáticos que los algoritmos de aprendizaje automático de última generación. Finalmente, el proceso de capacitación es mucho más simple y puede ser manejado por los expertos en la materia que usarán el sistema, incluso si no tienen experiencia en IA.

Uno de los productos de Cortical.io es Message Intelligence, ¿en qué consiste exactamente esta aplicación?

Message Intelligence encaja en la categoría de lo que se conoce como procesamiento inteligente de documentos. Las corporaciones están abrumadas con el procesamiento de una amplia gama de mensajes y documentos. Message Intelligence es una solución lista para usar que utiliza la tecnología de Cortical.io para extraer y clasificar con precisión la información clave en estos mensajes y documentos y procesarlos adecuadamente a escala empresarial. Debido al enfoque patentado de Cortical.io, permite el desarrollo de clasificadores personalizados en horas y modelos de extracción en días.

Otro producto en oferta es Inteligencia de contratos¿podría compartir algunos detalles sobre esto?

Cortical.io Contract Intelligence aprovecha un nuevo enfoque de la comprensión del lenguaje natural para analizar información relevante de grandes cantidades de documentos de forma rápida y con una precisión que es difícil de lograr a escala con trabajo manual o con otras herramientas de análisis de contratos. La solución ofrece una poderosa herramienta basada en el significado para extraer y clasificar información clave, buscar dentro de documentos individuales o en toda la base de datos, así como comparar documentos con una plantilla o versiones anteriores.

¿Hay algo más que le gustaría compartir sobre Cortical.io?

Estamos emocionados de ver la maduración de la inteligencia artificial y la comprensión del lenguaje natural desde una tecnología interesante hasta su integración en aplicaciones que resuelven problemas comerciales del mundo real.

Gracias por la gran entrevista, los lectores que deseen obtener más información deben visitar Cortical.io.

Deja un comentario