Formål
Lære hvordan man bygger klassifiseringsmodeller i R, tolke dem, og hvordan modellevaluering kan styrkes med kryssvalidering.
Innhold
- Eksplorerende dataanalyse
- Binær klassifisering
- "Feature importance"
- Multiklasseklassifisering
- Kryssvalidering
- *ekstra (hvis nok tid)*
- "Hyperparameter tuning"
- PCA og/eller klyngeanalyse*
Målgruppe
Primært for humanister, men også for forskere og studenter fra andre fagfelt som ønsker å få mer innsikt i maskinlæring. Kurset forutsetter at du har relativt god kjennskap til R. Grunnleggende kunnskaper i statistikk er også en fordel, men ikke et krav for deltakelse.
Hvis du ikke deltok på introkurset anbefales det å se følgende videoer før kursoppstart
Varighet
2x3 timer
Påmelding
Viktig: Deltakere må ha med egen bærbar PC eller Mac (laptop) med både R og RStudio ferdig installert. Både R (≥ 3.3.0) og RStudio er gratis, så det er ikke nødvendig å skaffe lisens. R kan lastes ned fra https://cran.r-project.org og RStudio fra https://www.rstudio.com/products/rstudio/download/.
Kurset holdes i et seminarrom, ikke en PC-stue. Det kan også være greit å ta med seg strømledningen til egen datamaskin. Hvis behov for bistand til installering kontakt lokal-IT på din enhet. Dersom du ikke har mulighet til å installere R og RStudio på egen maskin, kan du bruke UiO Programkiosk ("Statistikk fullskjerm").
Vennligst installér følgende pakker i R(studio)
MASS, xgboost, caret, pROC, patchwork, MLmetrics
*ekstra pakker* factoextra: Fremgangsmåte
Antall deltagere
20 (først til mølla)
Språk
Kurset holdes på norsk
Kursleder
Luigi Maglanoc PhD, Gruppe for datafangst og samlingsforvaltning, USIT.
Kontaktinformasjon
Har du spørsmål angående kurset, kan du sende en epost statistikk@usit.uio.no
Annen informasjon
- Datasett
- R-kode