Teksthub på UiO

Mange fagområder arbeider med med tekst og digital humaniora på UiO. I teksthuben skal vi  samle og koordinere kompetanse og erfaringer og bygge opp varig forskningsinfrastruktur som er nyttig for både forskning og undervisning.

Bildet kan inneholde: teknologi, elektronisk apparat, laptop.

Hva mener vi med tekst?

  • Tekst som skriftlig uttrykk
  • Muntlig tekst i form av tale

 

 

Innenfor hver av teksttypene er det et vell av undergrupper, som litteratur,  sakprosa og elevtekster som eksempel på skriftlig tekst, og videoopptak av samtaler, mer og mindre formaliserte intervjuer samt oppleste lister som eksempel på muntlig tekst.

De ulike typene tekst krever i noen grad ulik kompetanse, ulike verktøy og ulike tilnærmingsmåter. Samtidig er det mye å hente på felles løsninger. Maskinlæring kan for eksempel brukes like mye til muntlig og skriftlig tekst, og annoteringsverktøy kan også brukes på tvers av genre og medium.

Noder: 

1. Litteraturlesing med digitale verktøy
Deltakere: HF-ILN (Ibsensenteret, litteratur, EDD), HF-ILOS

2. Talespråk/korpus/(automatisk) transkripsjon:
Deltakere: HF-ILN (retorikk, lingvistikk, nordisk språkvitenskap og norsk som annetspråk, NORINT, MultiLing), HF-ILOS (engelsk, fremmedspråkene), MED, UV-ILS, UV-eVIR, USIT

3. Skriftspråkstekst/korpus
Deltakere: HF-ILOS (engelsk, fremmedspråkene), HF-ILN (EDD, nordisk språkvitenskap, norsk som andrespråk, lingvistikk, NORINT), HF-IFIKK, HF-IKOS, JUS, SV-STV, UV-ILS, UB

4. Maskinlæring, annotering (tagging, parsing) og statistikk
Deltakere: Deltakere: HF-ILN, MN-IFI, SV-STV, UV-eVIR, USIT (men kan være aktuell for all tekst og alle noder)

5. Databaseutvikling og modeller
Deltakere: kan være aktuell for alle

6. Nettdugnad (crowdsourcing)
Deltakere: HF-ILN-MultiLing, IFI, IFIKK, UV-IPED

7. Praterobot (chatbot):
Deltakere; HF-ILOS (fremmedspråkene), HF-ILN (norsk som andrespråk)

8. Koordineringsnode
HF-ILN (Tekstlaboratoriet): Koordinering av nodene, administrasjon og deltagelse i nodenes aktiviteter, personvern og GDPR, samt opphavsrett, TSD, nettside, datalagring, innkjøp av utstyr, organisering av kurs, møter og utstyr.

 

 

Publisert 7. nov. 2019 09:34 - Sist endret 13. jan. 2020 16:20