Translitteratoren oversetter lydskrift av dialekt til korrekt norsk skrivemåte

Det ILN-utviklede dataverktøyet er fritt tilgjengelig til forskningsbruk.

Joel Priestly forklarer en skisse av hvordan translitteratoren er bygget opp til fra v. Kristin Hagen og Janne Bondi Johannessen. Foto: Olaf Christensen.

Utviklingen av translitteratoren er en del av forskningsprosjektene LIA og NorDiaSyn. Disse prosjektene er finansiert av Norges forskningsråd, og de er nasjonale samarbeidsprosjekter som er ledet av professor Janne Bondi Johannessen fra Tekstlaboratoriet og ILN.

Transkribering av dialekter

Prosjektene har samlet store mengder lydopptak av norske dialekter. De eldste opptakene er fra 50-tallet. Ved siden av disse, har prosjektet opptak av amerikanorsk fra 40-tallet og fram til i dag. Amerikanorsk er norske dialekter som snakkes i USA. Se forskningssak om temaet.

Tekstlaboratoriet har ansatt studenter til å transkribere dialektene til lydskrift. Studentene måtte bestå en dialekttest før de fikk  lov til å starte med transkriberingen.

Fra lydskrift til korrekt norsk skrivemåte

-Det translitteratoren faktisk gjør er å oversette lydskriften av en dialekt til korrekt norsk skrivemåte, sier professor Janne Bondi Johannessen.

-Men, vi må alltid gå inn manuelt å sjekke etter at oversettelsen er gjort. Hvis translitteratoren har kommet over et ord den ikke kjenner fra før, gjetter den ut fra hva som ligger inne i databasen. Når vi har rettet opp vil translitteratoren aldri gjøre den feilen mer, sier senioringeniør Kristin Hagen.

Denne versjonen av translitteratoren oversetter til nynorsk. Tidligere har Tekstlaboratoriet utviklet en versjon som oversatte lydskrift av dialekt til bokmål. For øyeblikket er det 200 dialekter som ligger inne i databasen til translitteratoren. I praksis betyr det at translitteratoren inneholder 200 dialektordlister som er tospråklige mellom enkeltdialektene og bokmål eller nynorsk.  De største ordlistene inneholder ca. 6000 ord, som tilsvarer det antallet ord som har vært ytret i opptakene som ligger til grunn.

Hvorfor translitterere?

Målet for prosjektene er å gjøre talemålsmaterialet lett å forske i. Bare et enkelt ord som «eg» har massevis av uttalevarianter: e, æ, i, jæi, jei, æg, eg og så videre. En forsker som skal undersøke uttalevariasjon, vil få en nesten umulig oppgave dersom søking i materialet må gå via lydskriften. Når det derimot fins en translitterert versjon av hvert ord, blir arbeidet overkommelig, og forskeren vil få alle uttalevariantene i eksempelet ovenfor ved å søke på «eg».

Ikke avhengig av språk

Translitteratoren er ikke spesiallaget for å håndtere norske dialekter. Den er foreløpig også brukt til finlandssvensk og til noen spesielle svenske dialekter, men kan like gjerne brukes for språk i helt andre språkfamilier

-Vi vil gjerne få poengtere at translitteratoren er fritt tilgjengelig til forskningsbruk for alle som er interesserte, avslutter Janne Bondi Johannessen.

Nedenfor er det et skjermbilde fra transllitteratoren innstilt på Hemsedalsdialekt. Lydskrift av dialekten til høyre, mens teksten er oversatt til nynorsk til venstre:

 

Av Olaf Christensen
Publisert 15. apr. 2015 14:41