James Kaplan, cofundador y director ejecutivo de MeetKai – Serie de entrevistas

James Kaplan es cofundador y director ejecutivo de ConoceKaiun asistente de IA que facilita la vida a través de la conversación, la personalización y la curación.

Inicialmente, comenzaste a programar cuando solo tenías seis años, ¿qué te entusiasmó inicialmente con la codificación y qué idiomas aprendiste?

El ímpetu fue el juego Oregon Trail creado para Windows 95. Estaba enganchado y lo jugaba todos los días después de la escuela. Estaba en primer grado, ¡así que no había mucho más que hacer! Empecé a pensar en todas las cosas que me gustaría poder cambiar del juego. Cuando era más joven, compré una copia de «Programación de juegos para adolescentes», un libro de codificación básica en una librería local. Me atrajo instantáneamente y rápidamente olvidé mis motivaciones originales de Oregon Trail. Pero siempre me gustaron los juegos, y actuaron como mi motivación para aprender nuevos lenguajes de programación. Durante los siguientes años, aprendí Visual Basic cuando intentaba escribir un bot para NeoPets (funcionó) y luego PHP cuando tenía 12 años para comenzar a crear sitios web dinámicos. Incluso entonces, mi motivación para aprender PHP era ganar dinero para comprar videojuegos.

Su empresa anterior estaba operando un fondo de cobertura basado en IA, ¿qué aprendió de esta experiencia?

Mi mayor conclusión fue descartar la idea de que no se puede competir con gigantes en un espacio lleno de gente. Puede ser muy tentador pensar que, en finanzas, cualquier cosa rentable ya ha sido aprovechada y capturada por un jugador gigante. Sin embargo, rápidamente me di cuenta de que no debes sobrestimar a tus competidores. La pereza y la inercia organizativa prohíben nuevas ideas. Otras veces, una idea o campaña puede ser demasiado específica para una empresa más grande. Sorprendentemente, también pueden pensar que desarrollar algo es demasiado arriesgado, por lo que no vale la pena salir de su zona de confort.

¿Podría compartir la historia de génesis detrás del lanzamiento del asistente de inteligencia artificial MeetKai?

Estaba cansado de las finanzas. Todo tenía que medirse en términos de relación de Sharpe y PnLs. Eliminó gran parte de la diversión de la tecnología y estaba muy alejado de lo que originalmente me llevó al camino de la programación. A fines de 2018, hablé con Weili Dai, cofundador de MeetKai, sobre lo que vi en el panorama tecnológico en general. Una de mis principales observaciones fue que el espacio del asistente de voz estaba estancado. Todos los jugadores clave se aferraron a los enfoques antiguos y los usuarios no se estaban beneficiando de la tecnología. Nadie estaba dispuesto a probar nuevos enfoques, “ya ​​que no es así como lo hace X”. No hubo diferenciación. Si comencé desde cero y deseché todas (bueno, la mayoría) de las nociones preconcebidas de «cómo construir un asistente de voz», entonces podría cambiar fundamentalmente la experiencia del usuario. Comenzamos a construir un asistente de inteligencia artificial real en lugar de un chatbot con voz. Las lecciones aprendidas en mi empresa anterior junto con la tutoría de Weili nos llevaron a fundar MeetKai.

¿Cuáles son algunos de los desafíos detrás de la construcción de un asistente de IA?

Hay dos clases de problemas para construir un asistente de IA real: las expectativas del usuario y la implementación técnica. El primer problema se pasa por alto, pero es aplicable en MeetKai. Los usuarios están capacitados en lo que está y no está fuera de los límites cuando se trata de un asistente de voz. En particular, asumen que tienen que buscar de manera orientada a comandos. Estamos trabajando para capacitar a los usuarios para que busquen en lenguaje natural. Eso permite tipos de capacidades mucho más ricos, como el uso de negaciones «Encuéntrame una película de Dwayne «The Rock» Johnson que no sea Moana». Podemos manejar eso perfectamente en el habla cotidiana, pero los asistentes de voz actuales no nos responden.

La segunda clase de desafíos es técnica. Esto aparece en dos subcategorías: búsqueda y comprensión. Para la búsqueda, nos diferenciamos de otros asistentes virtuales en que mantenemos nuestro índice del contenido. Si bien esto permite toda la magia que nos convierte en la próxima generación, trae consigo los desafíos de ejecutar y mantener un motor de búsqueda personalizado que prioriza la voz. Esta es un área en la que estamos continuamente innovando. La comprensión del idioma es la segunda área en la que se enfrentan desafíos al crear un asistente de IA. Para la mayoría de los asistentes de voz, esto significaría poder entender el texto en inglés. MeetKai comprende y admite 16 idiomas. Esto no es 16 veces más trabajo, ya que usamos enfoques multilingües, pero sigue siendo una cantidad sustancial más que ser «inglés primero, solo inglés». Sin embargo, vale la pena invertir tiempo, ya que es increíblemente importante para nosotros que MeetKai sea verdaderamente global.

¿Cómo utiliza MeetKai la IA personalizada para diferenciarse?

Utilizamos IA personalizada en dos espacios diferenciados: comprensión y búsqueda.

Cuando un usuario dice: «¿Puedes encontrarme algo chino esta noche?», eso podría significar que quiere ver una receta china, un restaurante chino o un programa chino. Con nuestra comprensión profunda y personalizada, podemos eliminar la ambigüedad y brindarle al usuario el resultado que espera. Todo esto se hace sin que sus datos tengan que abandonar nuestra plataforma.

Horneamos la personalización en la búsqueda misma. Uno de los mayores problemas que enfrentan otros asistentes virtuales es que muchas de las búsquedas se envían a proveedores de cumplimiento de terceros. Cuando busca un restaurante con un asistente convencional, está pasando esa búsqueda a Yelp. La desventaja de eso es que Yelp no conoce al usuario personalmente, y si lo hacen, entonces es un problema de privacidad. Debido a que MeetKai es una aplicación propia, hasta el resultado, tenemos una verdadera personalización.

¿Cuáles son algunos casos de uso para MeetKai?

El objetivo de MeetKai es ser el primer conserje de IA. Queremos ayudar a los usuarios en su día a día. No queremos ser un asistente orientado a los comandos. No admitimos funciones como, «subir volumen», «bajar volumen», «temporizador de 30 segundos»,… te haces una idea. Creo firmemente que esas características no son IA, son solo entradas basadas en voz. Si recuerdas los días de AskJeeves, la idea era que era tu mayordomo, nadie antropomorfizaría al Asistente de Google. Por mucho que a Apple Siri o Alexa de Amazon les gustaría ser, nadie piensa en ellos como algo más que una aplicación. Todavía estamos en nuestras primeras etapas, pero construimos toda la tecnología necesaria para llevar a cabo nuestra hoja de ruta de tres a cinco años hacia un verdadero asistente de IA.

¿Cómo puede la industria evitar que un asistente de IA introduzca sesgos o refuerce los sesgos existentes en un usuario?

Existe un delicado equilibrio entre proporcionar resultados personalizados y no crear sesgos. Hemos visto lo que sucede cuando los investigadores optimizan las mediciones de participación en las plataformas de redes sociales: crea burbujas de sesgo. El primer paso hacia esto como industria es repensar nuestras métricas y KPI. En MeetKai, optimizamos para lograr un equilibrio entre el clic de destino y la novedad del clic. La IA debería ser mucho más recompensada por encontrar un resultado novedoso en el que se hace clic en el 30% de los casos, en lugar de simplemente el resultado «superior» en el que se hace clic en el 50% de los casos. Sin embargo, este enfoque tiene un retroceso bastante aparente tras una consideración más profunda. ¿Qué sucede si los resultados que obtiene la IA son solo resultados sesgados para la pequeña burbuja de ese usuario? Construimos nuestra IA para empujar en ambas direcciones de la zona de personalización de un usuario. Si un usuario solicita una lista de artículos sobre carne de res, entonces, en lugar de presentarle artículos que coincidan con sus creencias, podemos incluir artículos que están al borde, o ligeramente fuera del borde, de sus preferencias. Esto puede incluir un artículo sobre la ética animal y el cambio climático, así como un artículo sobre los beneficios potenciales para la salud de las grasas de origen animal. La intuición técnica del enfoque que hemos tomado se basa en la aceptación de que es difícil entrenar a la IA para determinar si Y está sesgada, pero es mucho más fácil entrenarla para saber que X y Z se encuentran en los bordes de la misma zona. como y

¿Dónde ve el futuro de los asistentes de IA en 5 o 10 años?

Los asistentes de IA se trasladarán cada vez más al enfoque propio que tiene MeetKai. Durante toda su existencia, Alexa y Google han tratado de cultivar un ecosistema de extensiones y habilidades de terceros. Esto se topa con algunos problemas serios en la privacidad. Además, esto no dice nada sobre los límites superiores que impone a las capacidades. Espero que más actores de la industria adopten el mismo enfoque que hemos tomado, y hay señales de esto en todos los ámbitos.

Gracias por la excelente entrevista, los lectores que deseen obtener más información sobre este asistente de IA personalizado deben visitar ConoceKai.

Deja un comentario