FYS-STK4155 – Anvendt dataanalyse og maskinlæring
Kort om emnet
Emnet gir en innføring i sentrale algoritmer og metoder som er viktige for dataanalyse og maskinlæring. Emnet er prosjektbasert og gjennom ulike prosjekter presenteres studentene for sentrale forskningstemaer i feltet.
Du lærer å utvikle og strukturere større koder hvor maskinlæring og dataanalyse er sentralt, samt anvende algoritmene og kodene for å kunne reprodusere kjente forskningsresultat og/eller studere nye system.
Hva lærer du?
Etter dette emnet har du :
- En grunnleggende forståelse av Bayesisk statistikk og kjente sannsynsfordelinger;
- En forståelse av sentrale algoritmer som brukes I data analyse og maskinlæring;
- Kunnskap om Monte Carlo metoder, Markov kjeder, Gibbs samplere, data optimering og deres anvendelser, fra numerisk integrasjon til simulering av aksjemarkeder;
- En forståelse av linær og ikke-linær regresjonsanalyse;
- Kunnskap om nevrale nettverk, genetiske algoritmer og Boltzmann maskiner;
- Erfaring i å jobbe med store numeriske prosjekter;
- Kjennskap til andre maskinslæringsalgoritmer som support vector maskiner, beslutningstrær, og nærmeste naboer.
Opptak og adgangsregulering
Studenter må hvert semester søke og få plass på undervisningen og melde seg til eksamen i Studentweb.
Studenter tatt opp til andre masterprogrammer kan, etter søknad, få adgang til emnet hvis dette er klarert med eget program.
Dersom du ikke allerede har studieplass ved UiO, kan du søke om opptak til våre studieprogrammer, eller søke om å bli enkeltemnestudent.
Forkunnskaper
Anbefalte forkunnskaper
Grunnleggende kunnskap om programmering og numerikk:
Ett eller flere av følgende emner:
- INF1100 – Grunnkurs i programmering for naturvitenskapelige anvendelser (videreført)
- IN1900 – Introduksjon til programmering for naturvitenskapelige anvendelser
- MAT-INF1100 – Modellering og beregninger
- MAT-INF1100L – Programmering, modellering og beregninger (videreført)
- MAT-IN1105 – Programmering, modellering og beregninger
- IN-KJM1900 – Introduksjon i programmering for kjemikere
- BIOS1100 – Innføring i beregningsmodeller for biovitenskap
Overlappende emner
10 studiepoeng overlapp mot FYS-STK3155 – Anvendt dataanalyse og maskinlæring
Undervisning
- Fire forelesninger per uke, i omtrent 15 uker.
- Fire timer i datalab for arbeid med numeriske prosjekter i uka, i omtrent 15 uker.
- Tre obligatoriske prosjektoppgaver, som hver teller 1/3 av endelig karakter.
- Ukesoppgaver.
Eksamen
- Tre prosjektoppgaver som hver teller 1/3 av endelig karakter i emnet.
Karakterskala
Emnet bruker karakterskala fra A til F, der A er beste karakter og F er stryk. Les mer om karakterskalaen.
Begrunnelse og klage
Evaluering av emnet
Vi gjennomfører fortløpende evaluering av emnet, og med jevne mellomrom ber vi studentene delta i en mer omfattende evaluering.