Whisper é un proxecto de OpenAI, e a súa utilidade consiste no paso de voz a texto. Como utilidade didáctica pódese empregar para que os docentes se comuniquen con alumnos doutras nacionalidades, como é o caso dos nenos ucraínos, pero tamén se pode empregar para traballar o speaking nunha lingua estraxeira. A páxina do proxecto é a seguinte:
https://github.com/openai/whisper
Para probar Whisper podémolo facer desde a seguinte páxina, iso si, empregando as nosas credenciais para acceder a github:
https://replicate.com/openai/whisper
Ta só temos que subir o ficheiros en mp3, indicar cal é o idioma do vídeo e a páxina, pasado uns minutos, imprime a transcrición do vídeo.
Instalación de Whisper
Para instalala aplicación na Maqueta Abalar 11, procedemos do seguinte xeito:
sudo apt install python3-pip
pip install -U openai-whisper
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust
pip install torch
pip install numba
pip install tiktoken
pip install dqdm
Execución de Whisper
Para executar a aplicación, abrimos o terminal e desde a conta de usuario, escribimos whisper. Podemos empregar este audio para comprobar o seu funcionamento
whisper 60.12_02_09.mp3 --language galician
Podemos inicar o número de cores que desexamos empregar, neste exemplo 4
whisper 60.12_02_09.mp3 --language galician --fp16 False --threads 4 > 60.12_02_09.txt
Obter a letra dunha canción de Youtube
A modo curiosidade podemos obter a letra dunha canción empregando o Whisper, aínda que para isto, seramente é máis rápido e fiable a páxina web www.musica.com
Descargamos o ficheiro mp3 por exemplo coa aplicativo yt-dlp_linux. Primeiramente instalamos o yt-dlp
cd Descargas
wget https://github.com/yt-dlp/yt-dlp/releases/latest/download/yt-dlp_linux
chmod +x yt-dlp_linux
Procedemos coa descarga
./yt-dlp_linux -x --audio-format mp3 --audio-quality 0 -o rap.mp3 https://www.youtube.com/watch?v=XOcyKObnwg4
Unha vez que dispoñemos do audio en formato mp3, empregamos o Whisper para extrarer a letra da canción:
whisper rap.mp3 --language en --fp16 False --threads 4 > rap.txt
