English version of this page

Autotekst i ny versjon: God og enkel automatisk teksting på norsk

Endelig har vi et godt og brukervennlig automatisk tale-til-tekst-verktøy. Det fungerer veldig bra på norsk tale, kan oversette automatisk til engelsk, bruker AI-teknologi, og sender ikke data ut fra UiO.

Jakten på god automatisk teksting

UiOs tekstingsverktøy Autotekst har kommet i ny versjon, med mye bedre teksting som krever mindre etterarbeid. – For to år siden utviklet vi tjenesten Autotekst for å gjøre det enklere tekste video. Det er et krav at alle forelesningsvideoer på uio.no skal være tekstet, og siden kravet trådte i kraft, har vi jobbet hardt for å komme fram til en teknisk løsning for god automatisk teksting, forteller leder for webutvikling på UiO, Dagfinn Bergsager. – Teksting er svært tidkrevende, så det har vært viktig å finne en løsning som krever minst mulig manuell teksting. Og nå har vi det! Det fungerer svært godt på norsk tale, til og med når den som snakker har dialekt!

Se en kort video om Autotekst og hvordan du kan ta den i bruk. 

Videoen er kun på 1 minutt og 54 sekunder, så dette har du tid til :)

Slik kan du bruke autotekst til å tekste video fra forelesninger som ligger på uio.no

  1. Last ned lydfila fra uio.no for videoen du skal transkribere
  2. Last lydfila opp i autotekst.uio.no og start transkribering
  3. Last opp .vtt-fila som autotekst lager sammen med videofila på uio.no
  4. Velg å redigere ediger video-fila og vel den opplastede .vtt-fila som undertekst

Se en kursvideo som gjør de stegene som er beskrevet over. 

Gi oss tilbakemeldinger på hvordan autotekst fungerer!

Autotekst var tidlig ute, og nå er verktøyet fornyet og forbedret

Autotekst, da den ble lansert, tok imot lyddata, sendte dem til Googles tjeneste Speech-to-Text og returnerte tekst. Problemet var at kvalitet på transkribering av norsk tale var veldig lav, og krevde mye etterarbeid. – Vi beregnet kostnaden til å renskrive teksting til alle forelesningsvideoer som publiseres på uio.no til 20 millioner kroner i året! I tillegg hadde vi personvernutfordringer med å sende data ut av Norge hver gang vi skulle transkribere, fortsetter Bergsager.

Men nå har Autotekst kommet i ny versjon, med ny, og mye bedre teknologi som driver tekstingen. Tjenesten som er lansert nå, krever vesentlig mindre etterarbeid og i mange tilfeller kan teksting legges ut uten å bli renskrevet i ettertid. Slik kan alle som må tekste video eller transkribere lyd, spare mye tid og ressurser.

OpenAI reddet oss

På slutten av høsten 2022, like før ChatGPT ble årets snakkis, lanserte OpenAi tjenesten Whisper. Dette er programvare som er basert på AI-modeller som kan kjøre på lokale servere. Utfordringen er at tjenesten krever veldig mye datakraft. Heldigvis har IT-avdelingen på UiO akkurat det – altså mye datakraft – så nå går verktøyet Whisper på vår egen infrastruktur uten at noe data forlater campus og UiOs servere.

Håndplukket spesialteam

Fotografi av teamet som utviklet og tilpasset den nye versjone av Autotekst
Dette er teamet som iløpet av en uke klarte å sette opp Whisper fra OpenAI på lokale servere. F.v: Håvard Helmersen, Aleksander Erichson, Katrine Nordeide Kuiper, Tor Magne Kippersund, Magnus Alderslyst Nygaard, Egil Elias Ravnå Birkeland og Dagfinn Bergsager (foran).

Før nyttår ble det satt sammen et tverrfaglig team av utviklere og interaksjonsdesignere som skulle endre tjenesten autotekst.uio.no, som vi allerde hadde, til å bruke Whisper til transkribering. I tillegg skulle de gjøre hele tjenesten mer brukervennlig og å ta i bruk flere nye funksjoner, blant annet automatisk oversetting til engelsk.

I løpet av uke 1 i 2023 ble hele prosjektet gjennomført på rekordtid og tjenesten ble skrevet om. IT-avdelingen lanserte en ferdigtestet fullversjon 1.februar 2023!

Vi har allerede fått mange tilbakemeldinger om hvor utrolig bra autotekst.uio.no nå klarer å gjøre om norsk tale med forskjellige dialekter til tekst.

Skjermbilde av Autotekst
Alle deler av autotekst.uio.no kjører på UiOs servere. Marker bildet for større versjon.

Neste steg: Integrasjon med mobilappen Nettskjema-diktafon

Allerede nå er det mulig å transkribere lydopptak tatt med mobilappen nettskjema-diktafon, men da må du første laste ned opptaket og laste det opp i autotekst.uio.no. I løpet av våren 2023 kommer alle lydopptak som lagres Nettskjema med diktafonappen, til å bli transkribert automatisk ved bruk av de samme serverne.

Mer om Autotekst

Publisert 8. feb. 2023 16:44 - Sist endret 27. feb. 2023 14:34