Whisper i TSD

Her er oppskrift til hvordan du kan transkribere med Whisper i TSD. Tjenesten er per 21.nov 2022 i en testfase. Oppsett kan endres.

1. Du må bestille tilgang til tungregning på Colossus for ditt prosjekt. PI må sende Epost til tsd-drift@usit.uio.no med prosjektnummer og si at du ønsker tilgang. 

2. Gå inn i ditt prosjekt og start putty. Deretter logger du inn på serveren "pxxxx-submit" og går til mappen /durable/:

cd /tsd/pxxxx/data/durable/

3. kopiere programvaren til å ligge under /durable:

cp -r /shared/software/whisper/ .

4. kopier inn lydfiler i durable/whisper/data/ ved hjelp av utforsker
NB: filnavn kan kun ha lovlige tegn og ikke mellomrom.

5. Kjør script når du står i folderen til /durable/whisper/ inn på pxxx-submit:

./transcribe_data

Se instruksjonsvideo

Denne videoen er tekstet med Whsiper både med NOR og EN som paramteer, og da kom følgende filer ut (som jeg har eksportert fra TSD)

 

Du kan endre teksting selv eller skru den av. Denne filmen er tekstet uten å bli redigert i etterkant. Jeg brukte Whsiper til å oversette ved å endre i whisper.sm.

Avanserte innstillinger

Du kan gjøre endringer selv i fila Whisper.sm

Her er 2 ting du kan endre:

  1. LANGUAGE=en Om du endrer denne til fra no til en får du automatisk oversatt transcriberingen(!)
  2. #SBATCH --time=00:20:00
    -om du har store filer, må du øke denne opp fra 20 min, ellers får du time-out.

Husk å lagre fila før du gjør kjører scriptet på nytt.

Åpne gjerne med Notepad++
Åpne gjerne med Notepad++

 

 

Av Dagfinn Bergsager
Publisert 21. nov. 2022 12:12 - Sist endret 2. des. 2022 18:17