Empresa de tecnología de texto a voz de inteligencia artificial (IA) Laboratorios WellSaid ha anunciado una ronda Serie A de $10 millones. La ronda fue dirigida por FUSE, junto con el inversor anterior Voyager, Qualcomm Ventures LLC y GoodFriends.
Según WellSaid, los fondos se utilizarán para promover aún más la IA y la innovación de productos, escalar las funciones de comercialización y hacer crecer el equipo de la empresa.
La compañía tiene como objetivo ofrecer a las empresas y marcas los mejores servicios de texto a voz (TTS), y permite a los creadores de contenido y equipos de productos desarrollar contenido de voz atractivo para diversos usos, como servicios de transmisión, radio, publicidad programática, marketing digital, y contenidos formativos corporativos.
Según el comunicado de prensa de la compañía, WellSaid “ha diseñado TTS para resolver los problemas de desarrollo de contenido más difíciles de las empresas y ofrecer una forma rápida para que los creadores de contenido, grandes o pequeños, desarrollen todo el contenido deseado en una voz coherente que represente su marca”.
WellSaid Labs tiene una biblioteca de Voice Avatar que ofrece acceso a múltiples estilos y tonos, y las marcas pueden desarrollar sus propios AI Voice Avatars con su propia semejanza, estilo y singularidad.
Cameron Borumand es socio general de FUSE.
“Simple y llanamente, WellSaid es el futuro de la creación de contenido para voz. Esta es la razón por la que a miles de clientes les encanta usar el producto a diario con una adopción ascendente fuera de lo común. Matt y Michael han formado un equipo de clase mundial y no podríamos estar más emocionados de ser parte del viaje de WellSaid”, dijo Borumand.
Discurso de sonido natural a partir de texto
Uno de los principales desafíos en el campo de la IA es el desarrollo de un discurso que suene natural a partir de un texto, en el que los investigadores han estado trabajando durante décadas. WellSaid Labs ha estado desarrollando los suyos durante los últimos tres años, logrando avances en calidad, velocidad y confiabilidad.
La compañía anunció en junio de 2020 que su texto a voz se convirtió en el primero en lograr la paridad humana en cuanto a naturalidad en clips de audio cortos en múltiples voces.
Matt Hocking es director ejecutivo de WellSaid Labs.
“Hemos agregado AI Voice al conjunto de herramientas de miles de creadores de contenido y sus equipos”, dijo Hocking. “Nuestra voz de IA de paridad humana se puede producir más rápido que en tiempo real y se puede actualizar a pedido. Abriendo oportunidades nuevas y emocionantes para “agregar voz” donde nunca antes se había percibido como posible. AI Voice garantiza fácilmente que cada producción se pueda crear y actualizar de manera eficiente a escala”.
Palabras de los inversores
James Newell es parte del equipo de Voyager Capital.
“Los creadores de contenido o los diseñadores de experiencias de productos se enfrentaban anteriormente a difíciles compromisos entre calidad y escalabilidad cuando usaban herramientas TTS o voz en off humana. Las increíbles voces de WellSaid, a las que se puede acceder a través de una aplicación de estudio o una API escalable, eliminan la necesidad de elegir si desea un discurso natural y realista o contenido de voz infinitamente escalable y fácilmente editable. WellSaid proporciona ambos y los entrega de la forma en que a su equipo le gustaría consumirlos”, dijo Newell. “Los equipos creativos han encontrado que es extremadamente útil cuando necesitan producir múltiples piezas de contenido de alta calidad en una voz consistente en horas en lugar de semanas”.
Carlos Kokron es vicepresidente de Qualcomm Ventures Americas.
“Los desarrollos recientes en la tecnología TTS que utilizan IA generativa han permitido que las voces sintéticas suenen muy parecidas a las humanas, encontrando nuevas y emocionantes aplicaciones para la voz, incluidos el aprendizaje electrónico, la publicidad y los lectores de noticias”, dijo Kokron. “WellSaid Labs proporciona un producto líder en la industria que genera voces similares a las humanas de alta precisión. Esperamos trabajar con WellSaid Labs para ayudar a impulsar la economía de los creadores con voces de IA de paridad humana en dispositivos móviles e IoT”.
Dave Gilboa es parte del equipo de Good Friends y codirector ejecutivo de Warby Parker.
“El equipo de WellSaid ha aplicado una profunda experiencia técnica para crear una plataforma que permite crear y editar fácilmente audio increíblemente real. Vemos un potencial de crecimiento significativo en el uso de audio de alta calidad para brindar a las marcas la capacidad de comunicarse con los clientes y a los creadores la capacidad de interactuar con el público”, dijo Gilboa.
Los desarrolladores de productos pueden acceder al motor de inteligencia artificial central de WellSaid Labs a través de API en tiempo real, lo que les permite potenciar las experiencias digitales con una infraestructura de voz escalable. Los creativos pueden superar las diversas barreras y complejidades que se encuentran en las tecnologías tradicionales de texto a voz.
Obtenga más información sobre WellSaid Labs y escuche las diversas voces de IA de la empresa aquí.