STK2100 – Maskinlæring og statistiske metoder for prediksjon og klassifikasjon

Timeplan, pensum og eksamensdato

Velg semester

Kort om emnet

STK2100 gir innføring i ulike metoder for styrt læring (regresjon og klassifikasjon). Emnet inneholder både modell- og algoritme-baserte tilnærminger. Hovedvekten vil være på styrt læring, men også ikke-styrte metoder som klustring vil bli omtalt. Emnet omhandler også problematikk knyttet til store datamengder.

Emnet gir et godt grunnlag for videre studier i statistikk eller Data Science, men er også nyttig for studenter som har behov for å gjøre dataanalyser i andre fagområder.

Hva lærer du?

Etter å ha fullført emnet:

  • kan du de fundamentale prinsipper for styrt læring (regresjon og klassifikasjon) samt hvordan en kan evaluere ulike metoder;
  • behersker du mange ulike metoder for styrt læring, inkludert  lineære modeller, logistisk regresjon, trebaserte metoder., bootstrapping og andre simuleringsbaserte metoder, dimensjons-reduksjon og regularisering,  bagging og boosting samt support vector machines;
  • har du kunnskap om problematikk knyttet til høydimensjonale data;
  • har du kjennskap til problemer knyttet til store datamengder og til metoder for ikke-styrt læring.

Opptak og adgangsregulering

Studenter må hvert semester søke og få plass på undervisningen og melde seg til eksamen i Studentweb.

Dersom du ikke allerede har studieplass ved UiO, kan du søke opptak til våre studieprogrammer, eller søke om å bli enkeltemnestudent.

Forkunnskaper

Obligatoriske forkunnskaper

I tillegg til generell studiekompetanse eller realkompetanse må du dekke spesielle opptakskrav.

Du må ha:

  • Matematikk R1 (eller Matematikk S1 og S2) + R2

Og en av disse:

  • Fysikk (1+2)
  • Kjemi (1+2)
  • Biologi (1+2)
  • Informasjonsteknologi (1+2)
  • Geofag (1+2)
  • Teknologi og forskningslære (1+2)

De spesielle opptakskravene kan også dekkes med fag fra videregående opplæring før Kunnskapsløftet, eller på andre måter.

Anbefalte forkunnskaper

Emnet bygger på STK1100 – Sannsynlighetsregning og statistisk modellering, STK1110 – Statistiske metoder og dataanalyse , MAT1100 – Kalkulus, MAT1110 – Kalkulus og lineær algebra og MAT1120 – Lineær algebraINF1100 – Grunnkurs i programmering for naturvitenskapelige anvendelser (videreført)MAT-INF1100 – Modellering og beregninger.

Undervisning

3 timer forelesning, 1 time plenumsregning og 2 timer gruppeundervisning/datalab hver uke hele semesteret.

Tilbudet i antall grupper kan justeres underveis i semesteret, avhengig av oppmøtet.

Eksamen

2–4 obligatoriske oppgaver.

Skriftlig eksamen.

Hjelpemidler

Godkjent kalkulator, formelsamling for STK2100.

Eksamensspråk

Du kan besvare eksamen på norsk, svensk, dansk eller engelsk.

Karakterskala

Emnet bruker karakterskala fra A til F, der A er beste karakter og F er stryk. Les mer om karakterskalaen.

Begrunnelse og klage

Adgang til ny eller utsatt eksamen

Dette emnet tilbyr både utsatt og ny eksamen. Les mer:

Tilrettelagt eksamen

Søknadskjema, krav og frist for tilrettelagt eksamen.

Fakta om emnet

Studiepoeng

10

Nivå

Bachelor

Undervisning

Hver vår

Eksamen

Hver vår

Undervisningsspråk

Norsk