Poner voz a un vídeo educativo o narrar un libro ayuda en muchas ocasiones a captar la atención y hace más accesible su contenido, pero hasta ahora para hacerlo se necesitaban herramientas (y conocimientos) que no siempre se tienen. Esta situación ha cambiado gracias a la IA, ya que se han creado herramientas como ElevenLabs, una plataforma web que emplea esta tecnología para transformar cualquier texto a voz y generar locuciones muy realistas para contenidos y usos de lo más variados: juegos, audiolibros, documentales, personajes animados, presentaciones audiovisuales… Y lo mejor de todo: es gratuita y muy fácil de usar.
Voces predeterminadas, tu propia voz…
Cuenta con una biblioteca de voces predeterminadas para diferentes aplicaciones (noticias, narración, animación…) a la que es posible añadir otras generadas por su comunidad de usuarios e, incluso, clonar la propia voz. También se distingue porque funciona con un modelo de IA que reproduce la entonación y la inflexión de las voces humanas con mucha fidelidad, adaptando el resultado al contexto específico que se necesita. Además, permite la descarga de todos los archivos de audio generados, y para usarla de forma gratuita solo hay que registrarse con un email y una contraseña o acceder a través de una cuenta de Google; aunque también ofrece diferentes planes profesionales y empresariales para ampliar algunas funciones. Estas son sus principales herramientas:
Conversión de texto a voz
Una voz en off para explicar vídeos educativos, un texto de larga duración que se desea convertir en audiolibro, un discurso para acompañar una presentación… Esta función es idónea para múltiples finalidades, ya que basta con escribir o pegar un texto en su caja y realizar algunos ajustes de configuración (el tipo y género de voz, la entonación, el estilo, la expresividad…) para obtener una locución muy similar a la de una voz humana en pocos segundos. Si el resultado inicial no es el esperado, es posible pulsar la opción ‘regenerar’ para obtener una nueva versión.
Transformación de voz a voz
Permite la grabación de un discurso o una narración hablada o, si se prefiere, subir un archivo de audio de hasta 50 MB para transformarlo en una locución expresiva. Para generar una muestra con diferentes voces -predeterminadas o creadas por el usuario-, es necesario habilitar el acceso al micrófono y grabarse leyendo algunas indicaciones que proporciona la IA.
Estudio de doblaje con ElevenLabs
Basta con subir un fichero de audio o un vídeo de hasta 500 MB o 45 minutos de duración para que la herramienta detecte el idioma original y el número de hablantes. Después, solo hay que seleccionar el idioma de destino entre los 29 disponibles, indicar un rango de tiempo para doblar y pulsar sobre ‘crear doblaje’. Cualquier parámetro se puede ajustar manualmente siempre que se necesite y también es posible importar vídeos desde redes sociales como TikTok, Vimeo, X o YouTube (sólo en inglés).
Creación de efectos de sonido
Es una de las funciones más curiosas y divertidas de la plataforma. Sirve para generar efectos como el rugido de un león, el ruido de un coche o las olas del mar rompiendo en un acantilado, y solo hay que explicar a la IA generativa lo que se necesita: cuenta con una caja de texto para describir el sonido que se busca, y una vez indicados los prompts y ajustados algunos parámetros -como la duración del efecto-, devuelve los resultados. Dispone también de una biblioteca de sonidos en la que explorar los efectos creados por otros usuarios y clasificados por temática: animales, latón, dispositivos, zánganos…
Clonación de voz
Ayuda a personalizar cualquier proyecto de audio, porque con esta herramienta es posible replicar la voz propia. Para hacerlo, es necesario subir un audio de un minuto y, a continuación, guardar el resultado en la biblioteca personal de voces. El proceso es prácticamente instantáneo, y una vez creada estará disponible para cualquier proyecto, incluso para generar discursos con gran realismo en diferentes idiomas.