Pedro Alves es el director ejecutivo y fundador de Ople.ai, una plataforma que empodera a los analistas y expertos en la materia con potentes análisis predictivos. La plataforma está equipada con el conocimiento y la experiencia de los científicos de datos líderes en el mundo para que los usuarios puedan concentrarse en lo que realmente se les da bien: crear un impacto comercial.
¿Qué le atrajo inicialmente de la ciencia de datos?
En 2001, vi un enorme potencial en el aprendizaje automático y la inteligencia artificial. Mientras estudiaba ciencias de la computación como estudiante universitario y decidía qué subcampo seguir, pensé: OK, AI/ML es un área de las ciencias de la computación que creo que es interesante: puede ayudar a predecir eventos en cualquier campo. Ya sea que esté en biología, medicina o finanzas, si tiene aprendizaje automático e inteligencia artificial, puede avanzar significativamente en esos campos. Siempre pensé que las matemáticas detrás de esto eran fascinantes.
Cuando ingresé a la escuela de posgrado, decidí que la mejor manera de mejorar mi experiencia en aprendizaje automático sería aprender a aplicarlo. Siempre fui muy práctico; No quería aprender teoría sólo por el bien de la teoría. Elegí estudiar el aprendizaje automático en su aplicación al campo de la genómica y la proteómica. Todo mi trabajo de posgrado fue en biología computacional, pero el enfoque estaba en el aprendizaje automático.
Poco después, ingresé a la industria de la salud, donde vi un gran potencial para las aplicaciones de IA/ML. Fue entonces cuando comencé a ver los problemas que tenía la IA en la práctica, fuera de la academia. Experimenté la realidad de la IA y aprendí cuán ineficazmente se había aplicado en el mundo real, y no por sus problemas técnicos. Entonces, me sentí atraído por solucionar el problema.
Anteriormente, fue científico jefe de datos en Banjo, donde abordó desafíos en el área de redes sociales. ¿Podría discutir algunos de esos desafíos?
Como empresa, detectaríamos eventos registrados en las redes sociales, específicamente eventos que debían destacarse como un peligro potencial, como un accidente automovilístico cercano o un edificio en llamas. Ayudaríamos a marcar estos eventos, para poder ayudar aún más a movilizar a los primeros en responder. Estábamos usando las redes sociales para siempre.
Muchos de esos eventos son raros, con respecto a los datos de las redes sociales. Por ejemplo, hay numerosos accidentes que ocurren todos los días en una ciudad determinada, pero cuando observa el volumen de datos de las redes sociales, la imagen de un accidente automovilístico se vuelve bastante pequeña. Considere los millones de fotos de cachorros, fotos de comida, otro millón de fotos de selfies y luego una foto de un accidente automovilístico, todo en el lapso de unos pocos minutos. Esencialmente, en Banjo, estábamos encontrando la aguja en el pajar.
Por lo tanto, uno de los desafíos que surgiría fue con respecto a la visión por computadora. Aunque la visión por computadora era decente en ese momento, cuando intenta encontrar uno en unos pocos millones, incluso una pequeña probabilidad de tasa de error puede diezmar por completo sus posibilidades de detectar estos eventos raros.
Por ejemplo, había un conjunto de datos público que, cuando se usaba para entrenar redes neuronales, hacía que no pudieran identificar el color. Incluso si una imagen en un conjunto de datos fuera colorida y la red neuronal mirara todo RGB, no usó el color como significante. Tome un coche de policía tradicional y un taxi tradicional: ambos son el mismo modelo de coche básico y una pieza adicional de maquinaria en la parte superior (es decir, sirenas en un coche de policía o una señal de libre/ocupado en un taxi). Pero, si miras el color, la diferencia entre los dos es evidente. Debido a esta instancia, pudimos comprender que crear un conjunto de datos adecuado es vital.
En 2017, luego lanzó Ople. ¿Cuál fue la historia de génesis detrás de esta startup?
Quería que las empresas recibieran un ROI sólido al implementar IA. Según Gartner, entre el 80 y el 90 por ciento de los proyectos de IA nunca ven la luz del día. Esto no tiene nada que ver con aspectos técnicos, como la precisión del modelo. Suele ser la cultura de la empresa o los aspectos de procedimiento dentro de la empresa.
Esto podría deberse a una falta de comunicación suficiente entre el equipo de ciencia de datos y el usuario comercial, lo que lleva a modelos que predicen algo que el equipo comercial no necesitaba porque el equipo de ciencia de datos no entendió lo que se necesitaba construir. O, si construyen el modelo correcto, cuando el equipo de ciencia de datos termina, el equipo de negocios no aprovecha las predicciones en absoluto. En la mayoría de las empresas, los departamentos como ventas, marketing y logística son los que realmente deberían utilizar la IA, pero es el equipo de ciencia de datos el que entiende los modelos. Cuando estos equipos no entienden los modelos que se construyen para ellos, tienden a no confiar en sus predicciones y, por lo tanto, no los usan.
Entonces, si la IA no está cambiando la forma en que la empresa hace negocios, ¿cuál es el punto?
Queríamos crear una plataforma que resuelva esto: queremos ayudar al equipo de ciencia de datos o a los analistas comerciales, analistas de datos, cualquiera que esté involucrado con la empresa en este proceso, a construir los proyectos correctos y ayudar a los empleados a comprender y confiar en los modelos. Si solucionamos eso, entonces creo que la ciencia de datos finalmente puede ser valiosa para las empresas de una manera real.
Ha dicho que los científicos de datos están perdiendo un tiempo valioso realizando tareas que pueden automatizarse con IA. ¿Cuáles son algunos ejemplos de tareas que deberían automatizarse?
Un científico de datos generalmente tardará varios meses en completar un modelo y, una vez finalizado, la empresa implementará dicho modelo, aunque probablemente no sea lo más preciso posible. En los meses posteriores a la implementación del modelo, el científico de datos continuará trabajando en él en un intento de aumentar la precisión del modelo en pequeñas cantidades incrementales. Aquí es donde generalmente muchos científicos de datos pasan su tiempo cuando podrían dedicarlo a otras tareas, como asegurarse de que los empleados entiendan, confíen y usen los modelos de IA en su lugar. Todo ese tiempo dedicado a tareas como ingeniería de características, modelos de entrenamiento, ajuste de parámetros y selección de algoritmos, tratando de aumentar la precisión de un modelo, se puede automatizar fácilmente con IA.
¿Puede describir qué es el metaaprendizaje y cómo lo aplica Ople?
Antes de llegar al metaaprendizaje, es importante comprender la primera capa del aprendizaje automático. Digamos que tiene un conjunto de datos que predice cuándo las máquinas se estropearán en la planta de una fábrica. La máquina avisará a los empleados que está a punto de averiarse, para que puedan realizar el mantenimiento preventivo. Esto se considera la primera capa de aprendizaje.
El metaaprendizaje, a menudo conocido como «aprender a aprender», es comprender mejor ese proceso de aprendizaje. Entonces, mientras entrena su modelo para predecir errores de máquina, tiene otro modelo observando. Por ejemplo, el segundo modelo podría ayudar a las empresas a comprender qué parámetros está aprendiendo bien el modelo de mantenimiento predictivo y qué parámetros no funcionan bien. Cuando hace metaaprendizaje, mejora en la construcción de modelos más eficientes, más rápido.
¿Cuáles son sus puntos de vista sobre los datos sintéticos?
Puede ser increíblemente difícil trabajar con datos sintéticos si no se ejecutan correctamente.
Digamos que tiene datos de registros médicos: tiene 20 pacientes, y para esos pacientes, tiene su edad, sexo, peso, altura, presión arterial, lista de medicamentos, etc. Es posible crear datos sintéticos con aprendizaje automático basado en estos registros médicos. Sin embargo, si confía solo en el aprendizaje automático o las estadísticas, puede terminar con datos sintéticos sin sentido. Puede crear una combinación aleatoria de los valores, como un niño de 3 años que mide seis pies de altura o una persona de 4 pies de altura que pesa mil libras. Si bien la inteligencia artificial y el aprendizaje automático son confiables en muchos casos, los datos sintéticos que se utilizan para los registros médicos deberían contar con la participación de un médico.
Entonces, involucra a un profesional médico para crear parámetros, como «si la persona tiene esta edad, ¿cuál es un rango de altura y peso realista» o «si está tomando este medicamento, qué medicamentos no debería tomar?» Este proceso inevitablemente se convertiría en un esfuerzo masivo y demasiado complicado para mapear todas las posibilidades, ya que pertenecen a los registros médicos de cada paciente.
Sin embargo, en el ámbito de las imágenes, los datos sintéticos pueden ser mucho más fáciles de comprender y crear. Digamos que tiene una imagen de un automóvil y el automóvil se encuentra en la esquina superior izquierda. No hace falta ser un experto para saber que ese mismo coche puede estar en la esquina inferior izquierda, en la esquina superior derecha o en el centro. La persona no solo puede apuntar una cámara de muchas maneras, sino que también puede realinear la imagen. Mover el foco de la imagen, de modo que el automóvil esté en todas las esquinas, está creando datos sintéticos; otro método simple es usar la rotación.
¿Puede dar algunos ejemplos de cómo Ople pudo ayudar a las empresas con sus necesidades de datos?
Ople.AI brinda a las empresas la capacidad de utilizar análisis de datos profundos en todos los niveles de una organización y brinda a sus empleados la oportunidad de desbloquear el valor de la IA, con solo unos pocos clics. A diferencia de las organizaciones que dependen de un pequeño equipo de científicos de datos para articular e implementar IA, la plataforma Ople.AI equipa a los empleados de varios departamentos con las herramientas para acceder a información de sus datos y, a su vez, aumentar su eficiencia diaria. .
Dicho esto, un gran obstáculo que las organizaciones a menudo enfrentan al implementar IA es la explicabilidad del modelo. Es vital para las empresas ofrecer IA que sus empleados puedan entender y, lo que es más importante, en la que puedan confiar. La explicabilidad del modelo ayuda con eso. Nuestro objetivo con Ople.AI Platform es brindarles a los empleados, que pueden no ser expertos en inteligencia artificial o tecnología, la oportunidad de comprender fácilmente cómo los modelos hacen predicciones y por qué. La creación de la explicabilidad del modelo generará resultados poderosos para las empresas a largo plazo.
Además, hay mucho más valor que un modelo puede aportar a las empresas además de hacer predicciones. La IA puede descubrir problemas potenciales o áreas que se pueden capitalizar. A eso lo llamamos explicabilidad de los datos: son las diversas formas en que un modelo puede compartir información inteligente sobre los datos que son valiosos para una empresa. Esta es una gran forma en que la IA puede ayudar a las empresas, y un área en la que estamos avanzando con respecto a nuestra competencia.
Gracias por la entrevista, los lectores que deseen obtener más información deben visitar Ople.ai.