top of page

Transcripción inteligente: conoce a Whisper de OpenAI

Carlos Graterol

13 de nov de 2023

En un mercado saturado de herramientas con frecuentes fallos en las transcripciones, Whisper destaca al ofrecer resultados superiores

En inSouth Magazine nos gusta mantenerte al tanto de todas las novedades y curiosidades tecnológicas. 

Leer más: Mitos y verdades sobre las baterías de los celulares


OpenAI ha presentado su última versión de Whisper, una inteligencia artificial diseñada para transcribir archivos de audio a texto con precisión y rapidez. En un mercado saturado de herramientas con frecuentes fallos en las transcripciones, Whisper destaca al ofrecer resultados superiores. Whisper es una tecnología basada en inteligencia artificial que simplifica la tediosa tarea de transcribir audio a texto. Al subir un archivo de audio al sistema, esta IA analiza el contenido verbal y lo convierte en palabras, eliminando la necesidad de intervención manual.

En su tercera versión, Whisper utiliza un sistema de reconocimiento automático de voz (ASR). Entrenada con más de un millón de horas de audio, logra una reducción significativa de errores, situándose con una tasa de error inferior al 5 % al transcribir en español. Además, puede reconocer múltiples idiomas y detectar cambios de idioma en una conversación.

Whisper es de código abierto y puede descargarse desde Github, aunque se requieren conocimientos técnicos avanzados. Para usuarios menos experimentados, Replicate ofrece una plataforma web (replicate.com/openai/whisper) donde pueden cargar archivos de audio y seleccionar el modelo deseado, incluida la versión v3 de Whisper. El servicio es gratuito para un uso básico, pero se requiere registro para funciones avanzadas.

Destacando por su capacidad para interpretar pausas en la conversación y su eficacia al colocar puntuación, Whisper supera a otras herramientas gratuitas que a menudo generan transcripciones inexactas. Su versatilidad se refleja en diferentes tamaños de modelos, adaptándose a diversas aplicaciones y necesidades.



En resumen, Whisper de OpenAI emerge como una solución fiable y eficiente para la transcripción de audio a texto, ofreciendo un avance significativo en la precisión y rapidez de este proceso. Fuente: Xataka


inSouth Magazine 8 años exaltando los valores de nuestra comunidad Latina. Síguenos en nuestras redes sociales como: @insouthmagazine en Instagram.

¡inSouth Magazine siempre contigo!

 

Seguir leyendo…

bottom of page