Leonelys Zacarías
2 de abr de 2024
Solo se necesita una muestra de 15 segundos para que la herramienta pueda desarrollar su creación
La última herramienta creada por OpenAI, la firma que deslumbró al mundo con ChatGPT, tiene la capacidad de clonar la voz humana de forma fidedigna con solo tener una muestra de tan solo 15 segundos.
Leer más: AT&T: investigación de fuga de datos de clientes
En un comunicado de la empresa, Sam Altman, anuncia los resultados de un modelo al cual llamaron "Voice Engine", que usa la muestra de 15 segundos más un texto para crear el habla natural, semejante a la muestra.
“Hoy compartimos información y resultados preliminares de una vista previa a pequeña escala de un modelo llamado Voice Engine, que utiliza texto y una única muestra de audio de 15 segundos para generar un habla natural que se asemeja mucho al hablante original. Es notable que un pequeño modelo con una sola muestra de 15 segundos pueda crear voces emotivas y realistas”- dijo Sam Altman.
El usuario, solo debe aportar esa muestra de 15 segundos y, una vez que el programa tenga la muestra, puede hacer que lea con el timbre y tono de voz cualquier texto que se le facilite. El texto ni siquiera debe estar en el mismo idioma que la voz aportada. Un hablante de español puede facilitar la muestra de audio en su lengua y luego pedir al programa que lea con su voz un texto en inglés, chino u otro idioma disponible.
Además, se puede utilizar la herramienta como un traductor de audios. Es más, cuando se utiliza para traducir, "Voice Engine", conserva el acento nativo del hablante original, por ejemplo: al generar el idioma inglés con una muestra de audio de un hablante de francés, se producirá un habla con un acento francés.
Fuente: El País
inSouth Magazine 8 años exaltando los valores de nuestra comunidad Latina. Síguenos en nuestras redes sociales como: @insouthmagazine en Instagram.
¡inSouth Magazine siempre contigo!
Seguir leyendo…