En términos generales, se lanzan alrededor de 22,000 nuevos podcasts en un mes. Hay cerca de 2,5 millones (más de 71 millones de episodios) en el directorio de Apple Podcasts en este momento, según Perspectivas de la industria de podcasts. Y esos son solo los que conocemos.
“Muchos podcasters ni siquiera están pasando por las grandes plataformas ahora. Se dirigen directamente a sus oyentes, venden contenido premium y tienen un gran éxito”, dice Andy Taylor, anteriormente de BBC Radio y fundador de la consultora de I+D con sede en Cardiff. Bwlb.
Y eso sin mencionar el creciente volumen de contenido tipo podcast, ya sea creado por marcas para promoción o productores de eventos que desean, por ejemplo, que las charlas estén disponibles bajo demanda. Cada pieza de contenido debe ser producida y distribuida, ya sea por profesionales del audio o por gente que esté aprendiendo el oficio. Por lo tanto, cuanto más puedan automatizar grandes franjas de producción, más podrán concentrarse en el contenido.
“Los diferentes lugares en los que se publica el audio se han disparado”, explica Jonathan Wyner, ingeniero jefe de M Works Mastering y profesor de Berklee College of Music en Boston. “Con todos esos contextos, existe una motivación real y un imperativo para que los creadores sean más versátiles”.
Sin mencionar, más productivo y eficiente.
El auge de la IA
La inteligencia artificial (IA), un software que puede automatizar tareas que antes realizaban los humanos, es la clave para manejar el tsunami de contenido de podcast. La IA no solo puede acelerar la producción, sino que también puede hacer que los podcasts suenen mejor y preparar el escenario para las experiencias de audio del mañana.
«La IA básicamente ayuda a encargarse de las tareas repetitivas para acelerar el flujo de trabajo del podcaster», explica Manos Chourdakis, ingeniero de investigación de Nomono, que desarrolla herramientas de podcasting basadas en IA. “Por ejemplo, con la IA, no es necesario escuchar un podcast completo para encontrar dónde alguien dijo algo incorrecto y luego reemplazarlo o eliminarlo. Podrías hacerlo tú mismo, pero la IA lo hace más rápido”.
Luego, hay tareas que solo se pueden realizar con IA, al menos a escala, como eliminar el ruido o mejorar el diálogo. “La mejora de los diálogos de buena calidad sería imposible sin la IA”, dice Chourdakis. “Al menos imposible en un plazo razonable usando herramientas tradicionales”.
Perfecto para tareas menores.
Las aplicaciones de la IA en el podcasting son tan variadas como las tareas de producción. Algunos están integrados directamente en las plataformas de podcast. Cuando los creadores suben sus podcasts a la plataforma de alojamiento Podcast.coel sistema «escucha» automáticamente los archivos de audio y normaliza los niveles de sonido.
“Cualquier herramienta que pueda ayudar a reducir las partes aburridas de un trabajo es algo bueno”, dice Mike Cunsolo, cofundador de la plataforma. Cunsolo también corre Señaluna productora de podcasts que trabaja con marcas corporativas, y Casamentero.fm, que conecta a los productores de podcasts con los invitados. “Siempre necesitarás ese elemento de experiencia humana, pero pronto las máquinas podrían aprender a comprender qué hace que un podcast sea interesante y reducir el tiempo dedicado a la tarea”.
Proveedor de soluciones Describir aplica IA a muchos aspectos de la ingeniería de podcasts, incluida la eliminación de ruido y el control de eco. Una de las tareas más «aturdidoras» que Descript puede manejar es el tono de la habitación.
“A veces, los productores necesitan insertar silencio digital en un podcast. Tal vez entre ediciones o para alargar el espacio entre oraciones”, dice Jay LeBoeuf, jefe de desarrollo comercial y corporativo de Descript. “Pero eso suena increíblemente antinatural”.
Si los productores no capturaron el tono de la sala cuando se grabó un podcast, es posible que tengan que regresar y obtenerlo. O pueden escucharlo en la grabación, copiar y pegar donde sea necesario, luego editar el resultado para que se mezcle de forma natural.
O las computadoras pueden manejarlo. El generador de tonos de habitación basado en IA de Descript analiza una grabación, identifica el tono de la habitación y lo sintetiza automáticamente donde se necesita. Esta tecnología no solo elimina las tareas domésticas, sino que permite una mayor flexibilidad de producción.
“La IA nos permitirá usar hardware menos costoso, habitaciones con peor sonido y ubicaciones más ruidosas y aun así obtener buenos resultados”, dice Chourdakis de Nomono.
Nuevas capacidades basadas en IA
AI también abre la puerta a la innovación en el podcasting, creando nuevas soluciones que elevan el nivel para los podcasters y los oyentes. Por ejemplo, la herramienta Epidemic Audio Reference (EAR) ayuda a los podcasters a encontrar música sin derechos de autor en función de las canciones que les gustan.
“Digamos que está buscando música de introducción o final, y está pensando en una canción en particular, pero está protegida por derechos de autor”, dice Chourdakis. “El sistema usa inteligencia artificial bajo el capó para ayudarlo a encontrar algo similar”.
En Bwlb, el equipo de Taylor desarrolló Acordeónuna solución basada en IA que puede tomar un podcast y reproducirlo en varias longitudes.
“Cada otra parte de nuestra vida se está volviendo más inteligente: hogares inteligentes, refrigeradores inteligentes”, dice Taylor. “La gente también quiere más control y comodidad de su experiencia de podcast”.
Cuando Taylor trabajaba en documentales para la BBC, le pedían versiones más cortas para ejecutar en diferentes plataformas. El proceso siempre fue manual. Accordion aplica algoritmos de software al contenido de los podcasts para crear de forma inteligente versiones de diferentes duraciones. “No acelera nada”, dice Taylor, “pero le da al usuario control sobre la duración del contenido sin perder la estructura tonal o la escuchabilidad”.
Poner el foco en la narración inmersiva
Cuantos más podcasters utilicen herramientas de IA, mejores serán. En otras palabras, cuantos más datos ingieren, más aprenden.
Los algoritmos de mejora de diálogo de Nomono se basan en grandes conjuntos de datos de grabaciones de voz, algunas claras e inteligibles, otras menos, que enseñan a las herramientas de IA cómo generar un mejor sonido. “Los creadores de podcasts no deberían necesitar conocimientos de audio avanzados para producir audio de alta calidad”, dice Chourdakis. “Al automatizar algunas de estas tareas, pueden dedicar más tiempo a concentrarse en una gran narración y menos tiempo a las tediosas tareas de limpieza”.
Y en el futuro, pueden evolucionar más fácilmente para crear un nuevo género de podcasts espaciales inmersivos. Por ejemplo, la tecnología de Nomono permite la producción de audio basada en objetos, lo que permite a los productores «colocar» voces en un paisaje sonoro 3D o crear versiones dinámicas que se pueden adaptar a los oyentes.
“La producción de medios ahora está entrando en una fase en la que si puedes soñarlo, puede suceder”, dice LeBoeuf de Descript. “Y ya no necesita tener un estudio costoso o décadas de capacitación para lograr sus objetivos”.