Sarah Nagy, fundadora y directora ejecutiva de Seek AI – Serie de entrevistas

Sarah Nagy es la fundadora y directora general de Buscar IA, una plataforma que permite a los usuarios finales de negocios hacer a Seek exactamente las mismas preguntas que actualmente le hacen al equipo de datos, directamente en Slack, Teams y correo electrónico. Sin «refinar» cómo escriben su pregunta, y sin aprender una nueva plataforma.

Inicialmente comenzaste como investigador con datos del Telescopio Espacial Hubble. ¿En qué estabas trabajando?

Estaba investigando en UCLA y Caltech, observando algunas de las galaxias más distantes que podían observarse con un telescopio, y estaba trabajando en el análisis de algunas de sus propiedades, como su masa y tamaño. El propósito de esta investigación fue ayudarnos a comprender la diferencia entre galaxias muy distantes y galaxias que están más cerca de la nuestra, y desarrollar modelos de cómo se forman estas galaxias con el tiempo.

Luego trabajó como científico de datos en varias empresas emergentes. ¿Cuáles fueron algunos de los proyectos más interesantes?

Un proyecto que se destaca involucró el uso de procesamiento de lenguaje natural (NLP) para clasificar texto no estructurado relacionado con artículos minoristas. Por ejemplo, tomar texto sin procesar (p. ej., «air jordans green») y etiquetarlo como la marca estimada («Nike»). Tenía un colega que se especializaba en PNL que estaba ocupado con un proyecto diferente, por lo que originalmente se suponía que yo no debía trabajar en este. Me lo entregaron porque estaban ocupados. Ni siquiera sabía nada sobre PNL en ese momento, así que asistí a algunos cursos gratuitos de Stanford y Fast.ai para aumentar mis conocimientos. Realmente disfruté aprendiendo sobre PNL y comencé a comprender por qué es tan importante y por qué la inteligencia artificial (IA) que puede comprender el lenguaje es un gran paso hacia la llamada «IA general». Esta experiencia definitivamente me preparó para comprender rápidamente la importancia de GPT-3 cuando salió por primera vez.

¿Podría compartir la historia de génesis detrás de Seek AI?

Cuando salió el modelo GPT-3 de OpenAI, inmediatamente reconocí el increíble avance que era y me entusiasmé especialmente con las aplicaciones que involucran la escritura de código GPT-3. Después de todo, estuve escribiendo código todo el día como científico de datos, y ver a la IA hacer esto, y generar el código perfectamente, fue asombroso. Compararía mi reacción a GPT-3 con la primera vez que aprendí sobre la realidad virtual en 2013, que fue otra experiencia asombrosa para mí. Terminé decidiendo que necesitaba formar una startup para apostar por esta tecnología. No sabía exactamente lo que iba a construir, pero tenía el presentimiento de que si aprendía más sobre estos modelos, algo valioso encajaría.

Una vez que realmente aprendí sobre los modelos, fue cuando me di cuenta de que podía resolver un punto débil que encontré en todos los lugares en los que había trabajado como científico cuantitativo o de datos. El problema en cuestión era que los empresarios no tenían las herramientas adecuadas para responder a sus propias preguntas sobre datos. Como científico de datos, con frecuencia trabajaba en problemas que requerían mucha atención, pero a menudo me interrumpían colegas del lado comercial que tenían preguntas sobre los datos, lo que me obligaba a dejar de hacer lo que estaba haciendo. El proceso parecía arcaico e ineficiente. Me di cuenta de que si me enfocaba en esta nueva tecnología para resolver el problema, sería una solución definitoria de categoría para este problema tan importante y omnipresente.

Seek AI utiliza IA generativa. ¿Podría explicar a nuestros lectores qué es esto?

«IA generativa» es una palabra de moda muy publicitada, pero a diferencia de otras palabras de moda, no creo que la publicidad sea injustificada. El término se refiere a grandes modelos de aprendizaje automático con cientos de miles de millones de parámetros, como Open AI. DALL-E y GPT-3. La innovación de estos modelos es que pueden comprender el lenguaje natural y generar texto, imágenes, código y más. Si alguna vez juega con DALL-E o Stable Diffusion, por ejemplo, comprenderá rápidamente por qué estos modelos están tan publicitados; tienen una capacidad increíblemente humana para comprender los comandos del lenguaje natural y pueden generar arte que rivaliza con los mejores artistas humanos.

La generación de código es una de las aplicaciones más específicas, pero más importantes, de la IA generativa. Los datos son cada vez más grandes y complejos y, por lo tanto, más difíciles de analizar y organizar manualmente por parte de los humanos. Sin embargo, hay tanta información codificada en estos datos. Esta información no solo es poderosa para las organizaciones, sino que también puede conducir a avances científicos increíbles en el ámbito académico. Construir IA para extraer valor de los datos desbloqueará un valor increíble en forma de información útil.

Seek AI está construyendo una interfaz que permite a los usuarios interactuar con los datos utilizando un lenguaje natural. Los trabajadores del conocimiento pueden acceder a la interfaz de lenguaje natural de Seek AI por medio de correo electrónico, Slack, mensajes de texto y una variedad de sistemas de administración de relaciones con los clientes (CRM).

¿Qué otros tipos de aprendizaje automático se utilizan en Seek AI?

Si bien la IA generativa es una parte de nuestra arquitectura de aprendizaje automático, nuestra arquitectura también incluye varias bifurcaciones de modelos de aprendizaje profundo de código abierto. Los modelos de transformadores (de los cuales la «IA generativa» es una variante) comprenden muchos (pero no todos) de los modelos que utiliza Seek.

¿Por qué es tan importante que los usuarios no técnicos puedan acceder rápidamente a los datos?

¿De qué sirven los datos si no están generando un ROI, y cómo puede una empresa obtener este ROI si los usuarios comerciales ni siquiera pueden acceder a ellos? Por eso es absolutamente esencial dar acceso a tantas personas como sea posible, sin comprometer la precisión.

Cuando era científico de datos, a veces recibía solicitudes del CEO para analizar algunos datos para ayudar con el producto de nuestra empresa o la estrategia de comercialización. Estos proyectos podrían llevar semanas o más. Como CEO ahora, definitivamente entiendo la importancia de esos proyectos a un nivel más profundo que cuando estaba en el lado de los datos. A menudo me encuentro deseando poder simplemente tener los datos al alcance de mi mano para poder tomar mis decisiones más rápido. Este es un ejemplo de lo que estamos resolviendo en Seek.

¿Cómo Seek AI hace que estos datos sean tan fáciles de recuperar?

Algo en lo que es interesante pensar es que los datos realmente solo pueden analizarse con código. Es cierto que hay plataformas que son abstracciones sobre este código (por ejemplo, tableros de datos), pero bajo el capó, hay un código escrito manualmente por analistas de datos que permite que los datos se presenten a los usuarios finales del negocio.

La mayoría de los trabajadores del conocimiento no saben codificar, no quieren codificar o simplemente no pueden acceder a los datos, incluso si quieren escribir código para analizarlos. Por lo tanto, cuando necesitan datos, deben ubicarlos en un tablero o preguntar al equipo de datos si no pueden encontrarlos. Cuanto más grandes sean los conjuntos de datos, más sucederá esto.

Por lo tanto, los equipos de datos deben ser «traductores» de las preguntas de lenguaje natural dirigidas a ellos y de los datos en sí mismos, que consultan mediante código. Eliminar este intermediario «traductor» es el corazón de lo que está haciendo Seek.

¿Cómo se aseguran las empresas de que los datos que utilizan sean precisos?

Gestionar el equilibrio entre la precisión de los datos y la accesibilidad es un gran desafío. Como dije en una entrevista reciente, por un lado, la accesibilidad permite que personas menos técnicas comiencen a interactuar con la fuente de conocimiento que son los datos de una empresa. Por otro lado, ¿de qué sirve un manantial de agua contaminada (es decir, datos malos)?

Los mejores equipos de datos son aquellos que gestionan esta compensación de la manera más óptima posible, y una gran parte de eso es calibrar y examinar cuidadosamente cualquier herramienta con la que los usuarios no técnicos puedan interactuar.

¿Cuáles son algunos ejemplos de casos de uso para la plataforma Seek AI?

Ya estamos entregando valor a los clientes y socios de diseño en los mercados verticales B2B SaaS, Fintech, Consumer Product Goods (CPG) y B2C e-commerce.

Aleta de batalla, por ejemplo, es el mercado líder de conjuntos de datos financieros alternativos. Creen que dar respuestas rápidas y de alta calidad a las preguntas de sus propios clientes es la diferencia entre ganar o perder frente a sus competidores. El director ejecutivo de la empresa, Tim Harrington, señaló: “Seek AI desempeñó un papel fundamental en la estrategia de nuestra empresa para 2023 debido a la ventaja que nos brinda para acceder y analizar nuestros más de 2400 conjuntos de datos en respuesta a las preguntas de los clientes. Estimaría que nuestro ROI en Seek AI es aproximadamente 10 veces mayor en función de lo que habríamos gastado para lograr este nivel de eficiencia sin la plataforma».

¿Hay algo más que le gustaría compartir sobre Seek AI?

Este podría ser el lugar adecuado para un enchufe desvergonzado. Seek actualmente ofrece pruebas gratuitas de nuestra plataforma, a las que se puede acceder en buscar.ai. Estamos emocionados de ser pioneros en llevar la IA generativa a los equipos de datos, y estoy ansioso por emprender este viaje con nuestros clientes.

Gracias por la gran entrevista, los lectores que deseen obtener más información deben visitar Buscar IA.

Deja un comentario