FYS-STK3155 – Anvendt dataanalyse og maskinlæring
Kort om emnet
Emnet gir en innføring i sentrale algoritmer og metoder som er viktige for dataanalyse og maskinlæring. Emnet er prosjektbasert og gjennom ulike prosjekter presenteres studentene for sentrale forskningstemaer i feltet.
Du lærer å utvikle og strukturere større koder hvor maskinlæring og dataanalyse er sentralt, samt anvende algoritmene og kodene for å kunne reprodusere kjente forskningsresultat og/eller studere nye system.
Hva lærer du?
Etter dette emnet har du :
- En grunnleggende forståelse av Bayesisk statistikk og kjente sannsynsfordelinger;
- En forståelse av sentrale algoritmer som brukes I data analyse og maskinlæring;
- Kunnskap om Monte Carlo metoder, Markov kjeder, Gibbs samplere, data optimering og deres anvendelser, fra numerisk integrasjon til simulering av aksjemarkeder;
- En forståelse av linær og ikke-linær regresjonsanalyse;
- Kunnskap om nevrale nettverk, genetiske algoritmer og Boltzmann maskiner;
- Erfaring i å jobbe med store numeriske prosjekter;.
Opptak og adgangsregulering
Studenter må hvert semester søke og få plass på undervisningen og melde seg til eksamen i Studentweb.
Dersom du ikke allerede har studieplass ved UiO, kan du søke opptak til våre studieprogrammer, eller søke om å bli enkeltemnestudent.
Forkunnskaper
Obligatoriske forkunnskaper
I tillegg til generell studiekompetanse eller realkompetanse må du dekke spesielle opptakskrav.
Du må ha:
- Matematikk R1 (eller Matematikk S1 og S2) + R2
Og en av disse:
- Fysikk (1+2)
- Kjemi (1+2)
- Biologi (1+2)
- Informasjonsteknologi (1+2)
- Geofag (1+2)
- Teknologi og forskningslære (1+2)
De spesielle opptakskravene kan også dekkes med fag fra videregående opplæring før Kunnskapsløftet, eller på andre måter.
Anbefalte forkunnskaper
Grunnleggende kunnskap om programmering og numerikk:
Ett eller flere av følgende emner:
- INF1100 – Grunnkurs i programmering for naturvitenskapelige anvendelser (videreført)
- IN1900 – Introduksjon til programmering for naturvitenskapelige anvendelser
- MAT-INF1100 – Modellering og beregninger
- MAT-INF1100L – Programmering, modellering og beregninger (videreført)
- MAT-IN1105 – Programmering, modellering og beregninger
- IN-KJM1900 – Introduksjon i programmering for kjemikere
- BIOS1100 – Innføring i beregningsmodeller for biovitenskap
Overlappende emner
10 studiepoeng overlapp mot FYS-STK4155 – Anvendt dataanalyse og maskinlæring
Undervisning
- Fire forelesninger per uke, i omtrent 15 uker.
- Fire timer i datalab for arbeid med numeriske prosjekter i uka, i omtrent 15 uker.
- Tre obligatoriske prosjektoppgaver, som hver teller 1/3 av endelig karakter.
- Ukesoppgaver.
Eksamen
- Tre prosjektoppgaver som hver teller 1/3 av endelig karakter i emnet.
Karakterskala
Emnet bruker karakterskala fra A til F, der A er beste karakter og F er stryk. Les mer om karakterskalaen.
Begrunnelse og klage
Evaluering av emnet
Vi gjennomfører fortløpende evaluering av emnet, og med jevne mellomrom ber vi studentene delta i en mer omfattende evaluering.