MacWhisper es el software de transcripción gratuito que estaba esperando

¿Está buscando un software para Mac para transcribir archivos de audio en archivos de texto escrito? Hay muchas herramientas pagas, como Otter.ai y Trint, que pueden costar dinero real cuando comienzas a usarlas demasiado. Pero MacSusurro es la solución gratuita que Internet ha estado esperando. O, al menos, el que estaba esperando.

OpenAI lanzó un programa gratuito increíblemente poderoso en septiembre de 2022 que permitió a las personas con algunos conocimientos técnicos convertir sus archivos de audio y video en transcripciones increíblemente precisas. El problema era que no era muy accesible para el usuario promedio, ya que necesitaba estar familiarizado con el uso de comandos en la aplicación Terminal.

Pero con MacWhisper, que fue visto por primera vez por 9to5Mac, alguien finalmente ha desarrollado una GUI, o interfaz gráfica de usuario, que se basa en Whisper de OpenAI y deja todas las cosas tecnológicas confusas bajo el capó, permitiéndole simplemente arrastrar y soltar su archivo de audio y obtener una transcripción muy rápidamente. Y MacWhisper es extremadamente preciso porque Whisper de OpenAI ha sido entrenado en 680,000 horas de datos de audio en la web.

Una de las cosas buenas de MacWhisper es que no está cargando el archivo de audio o video que desea transcribir a Internet. Eso es importante para los periodistas que pueden estar trabajando en una historia delicada, o cualquier persona que, en general, desconfía de cargar sus archivos personales en la nube. El archivo permanece en su escritorio, lo que significa que no hay posibilidad de que alguien pueda interceptar su audio.

Nuevamente, MacWhisper es solo una nueva interfaz de usuario para un programa gratuito que fue presentado por OpenAI a fines del año pasado, pero realmente hará que la transcripción de audio sea fácil para casi todos. Porque he estado usando Whisper y lo he encontrado tremendamente útil desde que fue lanzado. E incluso ahora usaré MacWhsiper, porque seguramente acelerará mi flujo de trabajo.

Como solo un ejemplo, después de la noticia del colapso de la compañía de criptomonedas FTX, usé Whisper para transcribir docenas de horas de entrevistas antiguas de YouTube con el fundador de la compañía, Sam Bankman-Fried. A partir de ahí, pude buscar en las transcripciones y encontrar ideas extrañas e interesantes para escribir artículos, como cuando SBF dijo en junio de 2021 que blockchain habría arreglado a Enron. La comparación de SBF con Enron fue una extraña coincidencia, dado todo lo que ahora sabemos sobre cómo colapsó FTX. Pero nunca hubiera encontrado ese momento en una vieja y oscura entrevista sin tener docenas de transcripciones que pudiera buscar. Y ese proceso, aunque más fácil que escuchar horas y horas de cintas, aún era torpe y no muy automatizado.

Después de instalar Whisper en mi máquina, solía escribir "susurro nombre de archivo de audio.mp3 —modelo tiny.en" en la aplicación Terminal de Mac cada vez que quería transcribir un archivo. Con WhisperMac, puedo simplemente arrastrar y soltar mi archivo de audio y hace su magia sin tener que escribir más.

Probé MacWhisper con un episodio de NBC Nightly News que descargué de YouTube. Y aparte de algunos errores, como interpretar la palabra "windchills" como "windshills" y escuchar a Lester Holt como "Lester Hold", la transcripción fue muy precisa. MacWhisper es gratuito, pero hay un nivel de pago del software que podría ser un poco más preciso porque utiliza los modelos de capacitación más intensivos de OpenAI, pero la versión gratuita funcionará muy bien para la mayoría de las personas.

MacWhisper le permite exportar la palabra transcrita en algunos formatos diferentes, incluido texto sin formato, CSV o incluso un formato de archivo de subtítulos como SRT y VTT.

Y MacWhisper no es solo para inglés. Puede transcribir audio en 100 idiomas diferentes, lo cual es increíblemente útil. La única característica que MacWhisper no tiene, con la que he disfrutado jugando en Whisper en la aplicación Terminal, es la traducción de idiomas. He traducido videos virales en ruso y chino y personas que hablan los idiomas me han dicho en Twitter que las traducciones son preciso.

La otra característica que MacWhisper no tiene, aunque tampoco está disponible en Whisper de OpenAI, es la capacidad de diferenciar los altavoces. Por ejemplo, si está transcribiendo una entrevista con dos oradores, no hay marcas claras que muestren cuándo un orador se detuvo y otro comenzó. Pero sospecho que alguien construirá esa capacidad eventualmente. Los servicios pagos como Trint hacen esto automáticamente, y sería genial tenerlos gratis eventualmente, pero obtienes lo que pagas.

También hay una función con MacWhisper en la que puede convertir el discurso del micrófono de su computadora en texto, lo que podría ser útil si desea transcribir algo sobre la marcha.

Pasé meses preguntándome cuándo alguien finalmente desarrollaría una GUI para Whisper, ya que algunas personas lo intentaron pero no crearon nada muy fácil de usar. Pero MacWhisper, desarrollado por Jordi Bruin, es el software que estaba esperando. Bruin también ha desarrollado software como MacGPT, que permite a los usuarios acceder a ChatGPT desde su barra de menú.

Puedes descargar MacWhisper gratis, con registro por correo electrónico, en el sitio web de Bruin.

Fuente: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/