Dra. Lingjia Tang, CTO y cofundadora de Clinc – Serie de entrevistas

Dra. Lingjia Tang, CTO y cofundadora de Clínica, es profesor de Ciencias de la Computación en la Universidad de Michigan. La investigación del Dr. Tang en la construcción de infraestructura de producción a gran escala para aplicaciones inteligentes es ampliamente reconocida y respetada en la comunidad académica. Además de trabajar tanto en Microsoft como en Google, Lingjia recibió su doctorado en Ciencias de la Computación de la Universidad de Virginia. Lingjia ha recibido recientemente premios prestigiosos que incluyen el Salón de la Fama de ISCA, los Premios de Investigación de Facebook y el Premio de investigación de Google.

¿Qué te atrajo inicialmente de la IA? ¿Cuándo descubrió por primera vez que quería lanzar un negocio de IA?

A mediados de la década de 2000, estaba investigando sistemas a gran escala que admiten varias aplicaciones y cómo podemos diseñar servidores como un sistema de software para ejecutar esas aplicaciones de manera más eficiente. En ese momento, estábamos pasando de trabajar con aplicaciones web tradicionales a más funciones impulsadas por el aprendizaje automático. Fue entonces cuando comencé a prestar atención a los algoritmos asociados con la IA y me interesé en comprender fundamentalmente cómo funcionan las aplicaciones de IA. Poco después, el equipo de investigación con el que estaba trabajando decidió dar un giro y básicamente crear nuestras propias aplicaciones de IA como puntos de referencia para estudiar, lo que nos llevó a publicar nuestros primeros artículos de investigación y a desarrollar nuestro primer producto, Sirius, un extremo abierto para -Asistente personal final de voz y visión.

Como software de código abierto, Sirius permitió a las personas crear asistentes virtuales conversacionales por su cuenta. En ese momento, esta era una capacidad muy limitada para el público en general y en realidad solo estaba controlada por las grandes empresas, como Google y Apple. Sin embargo, vimos que estábamos llenando un vacío crítico cuando lanzamos el software y vimos que tenía decenas de miles de descargas en la primera semana. Ese fue el punto de inflexión en el que supimos que había mucha demanda en el mercado para este tipo de software.

En 2015, lanzamos Clinc con la mentalidad de que seríamos capaces de proporcionar a todos, cada desarrollador, empresa, persona, que quiera poder construir un asistente virtual con el acceso a la experiencia, las herramientas y la innovación para poder hacerlo. .

Clinc ofrece soluciones de IA conversacional sin depender de palabras clave o guiones. ¿Podría entrar en algunos detalles sobre cómo se logra esto? ¿Cuáles son algunos de los desafíos del procesamiento del lenguaje natural (NLP) que tuvieron que superarse?

Lo que realmente distingue a Clinc de otras plataformas de IA conversacional en el mercado son sus algoritmos de IA subyacentes que permiten su experiencia de «humano en la habitación», que entiende el lenguaje desordenado y sin guión. Esto permite correcciones para retroceder y «curar» los errores cometidos en la conversación humana y permite flujos de conversación complejos, conversaciones que un ser humano real podría entender. A diferencia de un algoritmo de coincidencia de palabras de voz a texto, Clinc analiza docenas de factores de la entrada del usuario, incluidas las palabras, el sentimiento, la intención, el tono de voz, la hora del día, la ubicación y las relaciones, y utiliza esos factores para ofrecer una respuesta que representa un compuesto de conocimiento extraído de su cerebro entrenado. Por ejemplo, si le pregunto a mi asistente virtual “¿cuánto dinero gasté en una hamburguesa?” necesita entender que estoy preguntando sobre dinero y gastos, que estoy preguntando específicamente sobre una hamburguesa y que una hamburguesa es un tipo de comida y debe coincidir con mis gastos recientes en un restaurante.

Alcanzar este nivel de comprensión no es fácil. En general, dividiríamos la IA conversacional en dos componentes: comprensión del lenguaje natural (NLU) y gestión de diálogos. Entonces, el desafío que tuvimos que superar fue descubrir cómo construir un sistema que pueda extraer información clave con precisión y pueda anticipar lo que pregunta el usuario.

Podemos hacer esto a través de una NLU sofisticada, contextual y de arriba hacia abajo, que está capacitada para ser intuitiva por naturaleza para mantenerse al día con el flujo natural de la conversación, comprender la jerga y el contexto. Esto es en comparación con las soluciones de la competencia que tienen un enfoque de arriba hacia abajo basado en reglas para el procesamiento del lenguaje natural (NLP) que no permite la curación conversacional, lo que significa que si el cliente comete un error, las soluciones de la competencia lo hacen volver al punto de partida. , perdiendo el tiempo y solo frustrando al usuario. También usamos crowdsourcing para extraer nuestros datos de idioma para crear un conjunto de datos más rico y diverso que se puede usar de inmediato para entrenar modelos de IA.

¿Podría hablar sobre cómo se usa el aprendizaje profundo con el sistema de IA de Clinc?

Clinc está utilizando un enfoque híbrido para el aprendizaje profundo en el que usamos el modelo tradicional de la vieja escuela hasta cierto punto y aprovechamos el aprendizaje profundo donde sea necesario. Específicamente, usamos el aprendizaje profundo para comprender palabras e idiomas para determinar el flujo del diálogo. En general, todo nuestro diálogo es una combinación de aprendizaje profundo e IA simbólica. Todavía no usamos el aprendizaje profundo para la generación de lenguaje porque, cuando se trata de nuestros clientes que se encuentran principalmente en la industria bancaria, hay muchas regulaciones que el asistente virtual debe seguir que dictan lo que pueden y no pueden decir a sus clientes. . Por lo tanto, todavía hay mucha incertidumbre sobre si el aprendizaje profundo podrá o no seguir esas restricciones de idioma establecidas.

En este momento, no creo que la comunidad de IA conversacional esté completamente lista para adoptar completamente el aprendizaje profundo, mientras que la comunidad académica está 100% involucrada, pero espero ver qué pueden hacer los nuevos modelos.

¿Cuál es el proceso para una empresa que desea personalizar las respuestas de la IA para dirigirse a un público específico? ¿Podría dar algunos ejemplos de cómo los clientes utilizan Clinc actualmente?

Permitimos a los clientes licenciar una plataforma en la que pueden construir como quieran, o tomar nuestro chatbot completamente construido y entrenado, Finie, y personalizarlo e integrarlo en sus aplicaciones o servicios de mensajería. Finie puede manejar asuntos relacionados con saldos, transacciones, historial de gastos, ubicar un cajero automático, realizar una transferencia y más.

Mi ejemplo favorito de cómo un cliente ha personalizado la IA de Clinc para dirigirse a un público específico es İşbank. Como el banco privado más grande de Turquía, recurrieron a nosotros para desarrollar su asistente de banca digital, Maxi, en 2018. Para infundir a Maxi una personalidad única, İşbank realizó 14 grupos de enfoque para evaluar qué tipo de características y habilidades querían los clientes del banco en un entorno virtual. asistente. También contrataron a una actriz de doblaje para que recitara frases en turco relacionadas con las tareas bancarias. El equipo de banca conversacional de İşbank ideó estas oraciones considerando la forma en que la gente real expresaría sus necesidades. Siguiendo nuestra recomendación, el equipo pagó a los participantes en mercados de crowdsourcing como Amazon Mechanical Turk para que les proporcionaran diferentes formas de expresar las mismas preguntas, como una solicitud para ver sus saldos («cuál es mi saldo», «¿cuánto dinero tengo?» en mi cuenta”, “muéstrame el efectivo en mi cuenta”) o pagar una factura (“pagar mi factura”, “pago de facturas”).

Este ejemplo realmente muestra cuán invertido está İşbank en ofrecer un asistente de banca digital para ayudar a sus clientes a navegar mejor por sus cuentas. Con Clinc, İşbank lanzó Maxi a más de 7,5 millones de personas, en turco. Desde su lanzamiento, İşbank ha sido adoptado ampliamente por más de 5,5 millones de usuarios, con un promedio de 9,8 interacciones por usuario. En los últimos meses, a medida que aumentaron los casos de COVID-19 en Turquía, İşbank capacitó rápidamente a Maxi para que respondiera a las consultas relacionadas con el COVID-19. Desde marzo de 2020, Maxi ha respondido a más de 1,2 millones de consultas de clientes relacionadas con el COVID-19, un aumento de más del 62 % en el uso.

¿Qué le diría a las mujeres que están interesadas en aprender más sobre la IA pero que son reacias a involucrarse debido a que es un campo dominado por hombres?

De buenas a primeras, no creo que haya ninguna razón por la que la IA se considere un campo dominado por hombres. Creo que hay muchas mujeres pioneras en IA a las que les está yendo muy bien y están teniendo un impacto. Creo que la IA junto con la política social es un área única que tiene el potencial de tener un gran impacto en la vida cotidiana de las personas. Aquí es donde creo que una visión más diversa en todos los ámbitos realmente nos beneficiaría, especialmente porque hay muchas conversaciones sobre el sesgo de la IA que involucra raza y género. Creo que tener una comunidad de alcance de desarrolladores de IA seguirá teniendo un impacto desproporcionado en la sociedad y la política.

Para las mujeres que estén interesadas en unirse al campo de la IA, lo recomiendo encarecidamente, especialmente si están interesadas en tener un impacto. AI ha tenido mucho crecimiento e innovación a lo largo de los años y realmente es un momento emocionante para ser parte de ella.

¿Hay algo más que le gustaría compartir sobre Clinc?

Clinc está haciendo grandes avances en este momento. Personalmente, acabo de asumir un nuevo rol como CTO de Clinc y estoy muy emocionado de centrarme en cómo podemos seguir trabajando con desarrolladores y científicos de datos para aumentar el alcance de nuestra tecnología. Mientras miro hacia el futuro, veo que la demanda de aplicaciones impulsadas por IA está cambiando para permitir que las personas que no tienen años de experiencia en ciencia de datos y experiencia en aprendizaje automático también puedan usarla. Por ejemplo, no es necesario tener un título en diseño gráfico para poder usar Photoshop. Creo que la IA se dirige en esa dirección en la que los desarrolladores sin capacitación en IA o aprendizaje automático podrán lograr resultados y producir aplicaciones de alta calidad. En general, queremos reiterar que no solo estamos dedicados al usuario final sino también a los desarrolladores, sin importar el nivel, que muestren interés en nuestra solución.

Gracias por la gran entrevista, espero seguir su progreso. Cualquiera que desee obtener más información debe visitar clinc.

Deja un comentario