Hace apenas 15 días, un vídeo de Belén Esteban hablando perfecto inglés en un conocido programa de televisión comenzó a correr como la pólvora en la red social X (antes Twitter). Se trataba de un vídeo falso creado mediante la aplicación Rask.ai, una plataforma que permite a cualquiera traducir un vídeo y su audio a más de 130 idiomas, con tanta precisión que más de uno creyó que Belén Esteban o el Fary tenían auténtico acento ‘british’.
Pero Rask.ai no es la única plataforma que lo hace. Otras como por ejemplo HeyGen también es capaz de doblarla voz a cualquier idioma, o Kudo, y es que las posibilidades de la voz y la inteligencia artificial han comenzadoa expandirse a un ritmo interesante.
Esta semana, Spotify ha anunciado un piloto de traducción de voz para podcasts, una innovadora función basada en inteligencia artificial que traduce los contenidos a otros idiomas, todo ello con la voz del podcaster como si fuera bilingüe.
Según explica la propia compañía, “esta herramienta desarrollada por Spotify aprovecha las últimas innovaciones para adaptarse al estilo de la voz original, lo que permite una experiencia auditiva más auténtica que suena más personal y natural que el doblaje tradicional”. La realidad es que en el piloto presentado es increíble ver cómo una persona cambia de idiomas con tanta facilidad gracias a la tecnología.
Augurando el poder de la voz gracias al uso de la inteligencia artificial, Spotify compró en junio del año pasado una empresa especializada en esta tecnología, Sonantic, que ha construido un motor de IA para crear voces humanas que suenan muy realistas, pero simuladas, a partir de texto.
Otra compañía que parece estar interesada en la traducción simultánea con voces dobladas es Youtube. Es por ello que la empresa de vídeos propiedad de Google está trabajando en una herramienta que permite a los creadores de contenido doblar sus voces mediante inteligencia artificial de la mano de Aloud, un servicio que forma parte de la incubadora de productos experimentales de Google.
Asimismo, Meta presentó el pasado mes de junio Voicebox. En este caso esta herramienta está destinada a realizar tareas de generación del lenguaje, pudiendo producir clips de audio de alta calidad a partir de una muestra de dos segundos y editar audio pregrabado para recuperar en él la voz entrecortada por un ruido ambiente.
De hecho, la propia OpenAI, creadores de ChatGPT, ha anunciado esta semana una actualización que incluirá reconocimiento de voz. Gracias a esta nueva función se permite a una persona formular oralmente sus preguntas al chatbot, en vez de por escrito como hasta ahora, y escuchar cómo responde con su propia voz sintetizada, como si de un Alexa o Google Assintant se tratara.
Y es que este tipo de asistentes también quieren sacar el máximo partido a la IA ofreciendo a los usuarios conversaciones más fluidas y naturales. Es por ello que Amazon la semana pasada anunció un cambio en Alexa hacia esta dirección otorgando a su asistente de más inteligencia artificial para que pueda mantener conversaciones más naturales y fluidas.
Los peligros
Como ya viene pasando con el uso de esta tecnología, las posibilidades para duplicar la identidad de los usuarios son muy altas y cada vez están más al alcance de cualquiera, con los problemas que ello puede acarrear. Ya se han publicado vídeos o audios con la voz de famosos como Emma Watson haciendo comentarios violentos o aún más lejos, una canción falsa creada por IA con las voces de Drake y The Weeknd. Los doblajes son tan reales, que es muy complicado detectar que no son reales.
Pero más allá de las posibilidades de crear contenidos falsos, el hecho de poder doblar voces a cualquier idiomas a golpe de clic, supone una importante amenaza para algunos sectores creativos como los dobladores. De hecho, el Sindicato de Actores de Voz y Voice Talents de Madrid (AVTA) lanzó recientemente su primer comunicado pidiendo regulación para el uso de la inteligencia artificial. “El grado de desarrollo de estas aplicaciones es bastante avanzado y están en disposición de suplantarnos”, señalan.