STK2100 – Maskinlæring og statistiske metoder for prediksjon og klassifikasjon
Beskrivelse av emnet
Timeplan, pensum og eksamensdato
Kort om emnet
STK2100 gir innføring i ulike metoder for styrt læring (regresjon og klassifikasjon). Emnet inneholder både modell- og algoritme-baserte tilnærminger. Hovedvekten vil være på styrt læring, men også ikke-styrte metoder som klustring vil bli omtalt. Emnet omhandler også problematikk knyttet til store datamengder.
Emnet gir et godt grunnlag for videre studier i statistikk eller Data Science, men er også nyttig for studenter som har behov for å gjøre dataanalyser i andre fagområder.
Hva lærer du?
Etter å ha fullført emnet:
- kan du de fundamentale prinsipper for styrt læring (regresjon og klassifikasjon) samt hvordan en kan evaluere ulike metoder
- behersker du mange ulike metoder for styrt læring, inkludert lineære modeller, logistisk regresjon, trebaserte metoder, bootstrapping og andre simuleringsbaserte metoder, dimensjons-reduksjon og regularisering, bagging og boosting samt support vector machines
- har du kunnskap om problematikk knyttet til høydimensjonale data
- har du kjennskap til problemer knyttet til store datamengder og til metoder for ikke-styrt læring
Opptak til emnet
Studenter må hvert semester søke og få plass på undervisningen og melde seg til eksamen i Studentweb.
Spesielle opptakskrav
I tillegg til generell studiekompetanse eller realkompetanse må du dekke spesielle opptakskrav.
Du må ha:
Matematikk R1 (eller Matematikk S1 og S2) + R2
Og en av disse:
Fysikk (1+2)
Kjemi (1+2)
Biologi (1+2)
Informasjonsteknologi (1+2)
Geofag (1+2)
Teknologi og forskningslære (1+2)
De spesielle opptakskravene kan også dekkes med fag fra videregående opplæring før Kunnskapsløftet, eller på andre måter.
Anbefalte forkunnskaper
- STK1100 – Sannsynlighetsregning og statistisk modellering eller STK-FYS1110 – Sannsynlighetsregning, modellering og dataanalyse for de fysiske fagene
- MAT1100 – Kalkulus
- MAT1110 – Kalkulus og lineær algebra
- MAT1120 – Lineær algebra
- IN1900 – Introduksjon i programmering for naturvitenskapelige anvendelser
Overlappende emner
- 7 studiepoeng overlapp med STK4030 – Statistisk læring: Videregående regresjon og klassifikasjon (nedlagt).
Undervisning
3 timer forelesning og 2 timer regneøvelse hver uke hele semesteret.
Eksamen
Avsluttende skriftlig eksamen som teller 100 % ved sensurering.
Dette emnet har 2-4 obligatoriske øvelser som må være godkjent før avsluttende eksamen.
Hjelpemidler til eksamen
Godkjent kalkulator og formelsamling for STK2100.
Eksamensspråk
Dersom emnet undervises på engelsk vil det bare tilbys eksamensoppgavetekst på engelsk. Du kan besvare eksamen på norsk, svensk, dansk eller engelsk.
Karakterskala
Emnet bruker karakterskala fra A til F, der A er beste karakter og F er stryk. Les mer om karakterskalaen
Adgang til ny eller utsatt eksamen
Dette emnet tilbyr både utsatt og ny eksamen. Les mer:
Mer om eksamen ved UiO
- Kildebruk og referanser
- Tilrettelegging på eksamen
- Trekk fra eksamen
- Syk på eksamen / utsatt eksamen
- Begrunnelse og klage
- Ta eksamen på nytt
- Fusk/forsøk på fusk
Andre veiledninger og ressurser finner du på fellessiden om eksamen ved UiO.