Autotekst – nå med norske språkmodeller!

Autotekst, det UiO-utviklede KI-verktøyet som kan omforme tale til tekst, har nå tatt i bruk norske språkmodeller utviklet av Nasjonalbiblioteket. I den nye versjonen kan du også skille mellom forskjellige talere i samme opptak.

Skjermbilde av Autotekst på skjerm og mobil, med teksten Nasjonalbiblioteket + Whisper fra OpenAI = Autotekst som er enda bedre på norske dialekter

Språkrådet skryter av nyeste versjon av Autotekst.

Etter at Autotekst tok i bruk Nasjonalbibliotekets nye norsk-trente modeller av Whisper, er autotekst blit enda bedre på transkibering av norsk tale.

Åse Wetås, Direktør i Språkrådet, sier at de er veldig glade for at UiO har fått tilgjengeliggjort disse språkmodellene gjennom sin tjeneste Autotekst.

IT-avdelingen på UiO har hatt tett dialog med Nasjonalbiblioteket i arbeidet fram til april 2024 da vi lanserte ny versjon av Autotekst med to av deres modeller: NB Whisper og NB Whisper Verbatim. Begge modellene trent på norske data.

Det er ekstra gøy at UiO allerede har fått erfaring med at modellene fra Nasjonalbiblioteket bedre forstår norske dialekter og nå også tilbyr transkribering til nynorsk med vesentlig høyere kvalitet enn det som modellen fra OpenAI klarer.
Åse Wetås, direktør i Språkrådet
Direktøren i språkrådet, Åsa Wetås og IT-direktør Gard Thomassen foran en bokhylle
Direktøren i språkrådet, Åsa Wetås, her sammen med IT-direktør Gard Thomassen i UiOs nyoppussede bygg Domus Bibliotheca i Karl Johans gate. Språkrådet roser UiO for å være tidlig ute med å ta i bruk norske språkmodeller. Foto: Dagfinn Bergsager

Forelesningsvideoer automatisk tekstet

Lovverket krever at all undervisningsvideo skal være tilgjengelig og følge standardene for universell utforming. Det betyr at videoen tatt opp til bruk i undervisning må tekstes. Tidligere var dette svært tidkrevende, men nå kan tekstingen gjøres unna på en brøkdel av tiden. IT-avdelingen ved UiO har utviklet Autotekst, som har blitt et populært verktøy for transkribering av tekst. Fra oktober 2023 til april 2024 er det transkribert over 31 000 timer med lydopptak i tjenesten. 

På UiO er Autotekst fra januar 2024 en integrert del av Panopto-videoløsning som brukes for opptak av forelesninger. Det betyr at opptak av forelesninger nå kan bli automatisk tekstet via Autotekst.

Nettskjema har en egen mobilapp for opptak av lyddata. Etter at tjenesten startet å transkribere alle opptak automatisk, har bruken av diktafonappen økt kraftig. Per april 2024 er det over 10 000 aktive diktafoner som i snitt samler inn et opptak i minuttet som sendes til transkribering. 

Om Autotekst

Autotekst er et tekstingsverktøy som er utviklet og driftet ved IT-avdelingen på UiO. Verktøyet benytter seg av KI-teknologien Whisper, og gir svært gode transkripsjoner på norsk.

Det er beregnet at UiO sparer ca 20 000 000 kroner hvert år på å bruke Autotekst til teksting av forelesningsvideoer. Mange universiteter og høyskoler i Norge har tilgang til å bruke Autotekst og tjenesten er designet for å transkribere data i kategori rød - sensitive persondata.

Autotekst kjører kun på servere plassert på Blindern som driftet av UiO.

Enda bedre transkripsjon av norsk med Nasjonalbibliotekets språkmodell

Den nye versjonen av Autotekst, som allerede er tilgjengelig, gir deg mulighet til å velge hvilken språkmodell du vil bruke til transkripsjonen. Tidligere brukte Autotekst Open AI Whisper V2, som er en god modell. Nå kan du også velge å bruke Open AI Whisper V3, som er bedre enn V2. Den viktigste nyheten her er nok NB Whisper, som er Nasjonalbibiliotekets språkmodell. Denne er nå tilgjengelig i Autotekst. Med NB Whisper er gjenkjennelsen av norsk talespråk og norske dialekter bedre enn noensinne. Denne språkmodellen er trent opp på Nasjonalbibliotekets eget språkkorpus med norsk språk og er ikke begrenset til det Open AI har hatt tilgjengelig til i sine Whisper-versjoner. Dette er unikt i verdenssammenheng. 

Alle språkmodellene kan transkribere til engelsk og en rekke andre språk, men NB Whisper er nå standardinnstillingen og anbefalt modell i Autotekst når språket i opptaket er norsk. Denne modellen klarer også å transkribere til nynorsk med vesentlig høyere kvalitet enn det andre modeller klarer.

To viktige nye funksjoner

I tillegg til nye språkmodeller, har Autotekst også andre forbedringer. Nå er det et tilleggsvalg du kan huke av for, for å skille mellom talere. Dette er en svært nyttig funksjon hvis det er flere personer som bidrar i opptaket. Da gjenkjenner Autotekst stemmen til de forskjellige talerne, og markerer utsagn fra hver av dem i transkripsjonen. 

Den andre nyvinningen er at du nå også kan velge faktisk og ordrett transkripsjon. Både Open AI Whisper og NB Whisper utfører gjettinger, legger inn tegnsetting og fjerner fyllord. Hvis du for eksempel uttaler et ord utydelig, vil transkripsjonen inneholde det Whisper tror at du sa. Om du bruker fyllord som eh eller hmm og lignende, vil de ikke komme med i transkripsjonen. Dette er i de fleste tilfeller nyttig, men hvis du forsker på språkbruk og trenger faktisk ordrett transkripsjon - kan du nå velge språkmodellen NB Whisper Verbatim.  Mange forskere har ønsket seg en modell som transkriberer akkurat det som blir sagt, og modellen NB Whisper Verbatim er designet for dette formålet. Vi er spent på hvordan dette blir mottatt av forskere når de får tatt disse modellene mer i aktiv bruk, sier Pål Fugelli, seksjonssjef for apputvikling på UiOs IT-avdeling.

Modell deles fritt fra Nasjonalbiblioteket

Seksjonssjef Pål Fugelli. Foto: Marie Wangensteen

Den største nyvinningen i den nye versjonen av Autotekst er NB Whisper. Den er basert på Open AIs Whisper, men er forbedret med store mengder materiale fra Nasjonalbiblioteket og er den første egentlig norske språkmodellen for AI. – Det at Nasjonalbiblioteket deler arbeidet sitt, fritt og åpent, er en fantastisk gave til alle som jobber med slike løsninger – og de som bruker dem, sier Pål Fugelli.

– Dette er fordelen med at offentlige institusjoner er med på utviklingen. Da kommer det alle til gode. Takket være NB Whisper tar talegjenkjenning og -transkribering er stort skritt framover. Nye Autotekst med NB Whisper vil spare UiO og de andre brukerne for utrolig mye målt både i kostnader og i tid, avslutter Fugelli. 

 

Se alle som har avtale om bruk av Autotekst

  • Arkitektur- og designhøgskolen i Oslo
  • Direktoratet for høyere utdanning og kompetanse
  • Helsedirektoratet
  • HL-senteret
  • Høgskolen i Innlandet
  • Høgskolen i Molde
  • Høgskolen i Østfold
  • Høyskolen Kristiania
  • Høgskulen på Vestlandet
  • MF vitenskapelig høyskole
  • NLA Høgskolen
  • Norges idrettshøgskole
  • Norges musikkhøgskole
  • NMBU
  • NORCE
  • NTNU
  • OsloMet
  • Patentstyret
  • Politihøgskolen
  • Stiftelsen Handelshøyskolen BI
  • Universitet i Agder
  • Universitetet i Stavanger
  • Universitetet i Sørøst-Norge
  • Utdanningsetaten
  • VID vitenskapelige høgskole
  • Universitetet i Bergen
  • Sikt
  • Nord Universitet
  • Norges Handelshøyskole
  • CICERO Senter for klimaforskning
  • Norges forskningsråd
  • Fagskolen Innlandet
  • Høgskulen i Volda
  • Fagskolen i Agder
  • NKVTS
Publisert 17. apr. 2024 17:03 - Sist endret 30. apr. 2024 14:27