Ir o contido principal
  • Inicio
  • e-dixgal
    • sesion_01
    • sesion_02
    • sesion_03
    • sesion_04
  • AI
  • Drupal
  • GNU-Linux
    • Debian
    • Arch Linux
    • LibreOffice
    • Latex
    • RStudio
  • Moodle
  • Espazo Abalar
  • Procurar

Whisper. Pasar de voz a texto.

Por webmaster, 29 Xaneiro, 2024
AI

Whisper é un proxecto de OpenAI, e a súa utilidade consiste no paso de voz a texto. Como utilidade didáctica pódese empregar para que os docentes se comuniquen con alumnos doutras nacionalidades, como é o caso dos nenos ucraínos, pero tamén se pode empregar para traballar o speaking nunha lingua estraxeira. A páxina do proxecto é a seguinte:

https://github.com/openai/whisper

Para probar Whisper podémolo facer desde a seguinte páxina, iso si, empregando as nosas credenciais para acceder a github:

https://replicate.com/openai/whisper

Ta só temos que subir o ficheiros en mp3, indicar cal é o idioma do vídeo e a páxina, pasado uns minutos, imprime a transcrición do vídeo.

Instalación de Whisper

Para instalala aplicación na Maqueta Abalar 11, procedemos do seguinte xeito:

sudo apt install python3-pip
pip install -U openai-whisper
pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip install setuptools-rust
pip install torch
pip install numba
pip install tiktoken
pip install dqdm

Execución de Whisper

Para executar a aplicación, abrimos o terminal e desde a conta de usuario, escribimos whisper. Podemos empregar este audio para comprobar o seu funcionamento

whisper 60.12_02_09.mp3  --language galician

Podemos inicar o número de cores que desexamos empregar, neste exemplo 4

whisper 60.12_02_09.mp3  --language galician --fp16 False --threads 4 > 60.12_02_09.txt

 

Obter a letra dunha canción de Youtube
 

A modo curiosidade podemos obter a letra dunha canción empregando o Whisper, aínda que para isto, seramente é máis rápido e fiable a páxina web www.musica.com 

Descargamos o ficheiro mp3 por exemplo coa aplicativo yt-dlp_linux. Primeiramente instalamos o yt-dlp

cd Descargas
wget https://github.com/yt-dlp/yt-dlp/releases/latest/download/yt-dlp_linux
chmod +x yt-dlp_linux

Procedemos coa descarga

./yt-dlp_linux -x --audio-format mp3 --audio-quality  0 -o rap.mp3  https://www.youtube.com/watch?v=XOcyKObnwg4 
 

Unha vez que dispoñemos do audio en formato mp3, empregamos o Whisper para extrarer a letra da canción:

whisper rap.mp3  --language en --fp16 False --threads 4 > rap.txt

 

Canle RSS