Jon Vegard bruker avansert dataanalyse til å forutsi hvor lenge en sykmelding vil vare

- Vi jobber for å hjelpe folk å klare seg i livet. Vi er til for innbyggerne. Det tiltaler meg!

Jon Vegard Sparre i kantine hos NAV

Jon Vegard Sparre, master i teoretisk fysikk. Data scientist / dataviter i AI-lab hos NAV.

Visste du at NAV har et av Norges største IT-miljøer?

Jon Vegard Sparre jobber som data scientist i AI-lab hos NAV, en gruppe som er spesialister på kunstig intelligens. I gruppa er det 7 data scientists, 4 med fysikk-utdanning.

-Hva går jobben din ut på, Jon Vegard?

-Jeg analyserer data. Det kan dreie seg enkle statistiske analyser som for eksempel å finne ut hvor mange som har fått avslag på NAV-støtte med noen spesifikke kjennetegn. Dette er med andre ord veldig enkel graving etter tall.

Jeg jobber også med mer avansert maskinlæring for å utvikle systemer som kan forutsi hva som sannsynligvis vil skje, før det skjer.

Maskinlæring vil si at et dataprogram lærer seg å løse en oppgave basert på data.

“Hvor lenge blir du syk?”

-Et stort prosjekt som jeg er med på er å lage en modell som kan forutsi hvor lenge en person kommer til å være syk.

Modellen skal være en hjelp for veiledere i NAV og gi den som er sykmeldt bedre oppfølging, forteller han.

-Hvordan kan dette hjelpe folk?

-Når du er sykmeldt lenge skal det gjennomføres dialogmøter, det vil si møter mellom NAV, arbeidsgiver, lege og den som er sykmeldt. Hvis programmet vårt forteller at sykmeldingen mest sannsynlig snart er over er det ikke nødvendig å gjennomføre møtet, forklarer han.

-Vi må lage kunstig intelligens-systemer som er rettferdige

-Jeg ser spesielt på to ting, som er veldig viktig når en lager maskinlæringsmodeller, og som er to av satsingsområdene for oss i AI-lab. For det første må vi passe på at modellen er rettferdig, sier Jon Vegard.

Du har kanskje hørt om det amerikanske dataprogrammet COMPAS? Basert på historiske data forutsier en maskinlæringsmodell sannsynligheten for at en fange vil begå ny kriminalitet. Dommere i amerikanske rettssaker brukte programmet når de skulle bestemme om fanger skulle løslates eller ikke.

Det viste seg at modellen var rasistisk, og svarte fanger fikk sjeldnere prøveløslatelse. Programmet hadde lært av dommene som allerede var avsagt, og avslørte dermed at de amerikanske dommerne var strengere med svarte kriminelle.

… og som forklarer oss resultatene

-For det andre må vi passe på at programmet vårt forteller hva det baserer resultatet på, sier Jon Vegard. Den som er sykmeldt har rett på en forklaring på hvorfor systemet forutsier at sykmeldingen sannsynligvis varer 8 uker til, for eksempel.

NAV-veilederne har bruk for en annen forklaring, og vi som har utviklet modellen trenger en annen, mer teknisk forklaring.

-Hva er det beste ved jobben din?

-Jeg liker veldig godt bredden i arbeidsoppgaver og at det er stort spenn i fagområder.

Juss og diagnoser

-Særlig må vi vurdere det juridiske, om vi har lov og om det er hensiktsmessig det vi gjør. Jeg må beskrive prosessen og finne lovhjemmel sammen med jurister. Datasikkerheten skal vurderes og konsekvens for hver enkelt person dokumenteres. 

Vi må også kunne noe om diagnoser. Det finnes flere forskjellige systemer, så vi må finne ut hvordan vi kobler dem sammen og passe på så ikke lårhalsbrudd og utmattelse blir behandla som samme type sykdom.

De siste årene har NAV innført nye måter å jobbe på. Istedenfor at vi har store IT-prosjekter jobber vi i mindre produktteam og med mindre omfattende jobber som kan være ferdig raskt. Det er smart ved for eksempel lovendringer, som gjerne har en streng tidsfrist vi må forholde oss til. 

Produktteamene består av ulike folk med forskjellige fagbakgrunner, så på denne måten blir det mer tverrfaglig jobbing, sier Jon Vegard.

-Hva liker du minst med jobben?

-NAV er en stor organisasjon, og det er mange lover og regler som skal følges, noe som gjør at det er *veldig* mye å sette seg inn i. Som i alle store organisasjoner går ting litt tregt.

Du må ihvertfall være litt tålmodig for å jobbe i NAV!

urbant område, person foran vindu, ny og gammel arkitektur
NAVs hovedkontor har flott utsikt mot Mølla ved Akerselva i Oslo

-Hva gjør du på jobben, rent konkret?

- Jeg bestemmer i stor grad over arbeidsdagen min selv. Noe tid går med til møter for å få tilgang til data eller å diskutere med andre i teamet hva vi skal gjøre videre. 

Når det ikke er møter holder jeg på med dataanalyse og modellbygging.

Som en kjempestor “oblig”

Jeg programmerer i Python, som er det samme språket som vi brukte i studiet. På mange måter er det som å sitte på Blindern og gjøre en kjempestor oblig - en obligatorisk innleveringsoppgave.

Og så må jeg skrive dokumentasjon av det jeg gjør. Det høres kanskje kjedelig ut, men det er faktisk morsomt!

Det aller nyttigste jeg lærte i studiet var Python-programmering, og maskinlæringen jeg lærte meg da jeg tok master.

I masteroppgaven min utviklet jeg en modell for å simulere supersymmetriske partikler, en type partikler som mange tror kan finnes, men som vi ikke har sett ennå. De vil kunne forklare hva mørk materie er og en hel del andre problemer i teoretisk fysikk.

-Som data scientist må du sette deg inn i mange problemstillinger og tenke matematisk på virkeligheten, du må se koblingen mellom dataene og den virkelige verden. Da tenker jeg at det er en fordel å ha fysikkbakgrunn.

Mennesker i datasettet

Etter at jeg begynte å jobbe er det blitt klarere for meg at data bare er en representasjon av virkeligheten, ikke virkeligheten selv. Og data kan ha innebygde skjevheter etter hvordan de er samlet inn eller plukket ut.

-Når du har mennesker i datasettet blir det ofte sånn, mener Jon Vegard. Hvis vi for eksempel skal plukke ut 10 prosent av sykemeldingene, fordi vi ikke trenger mer data enn det. Da må vi passe på å ikke ta bare januar, når alle har influensa for eksempel. Kanskje det er lurt å ta med flest sykmeldinger fra vår og høst for å få mest variasjon i datasettet? Sånne ting må en ta hensyn til.

Russisk fysikklærer

-Hvorfor valgte du å studere fysikk? 

-Jeg hadde en veldig engasjerende fysikklærer på videregående. En russisk dame. Jeg husker hun sto og trampet i gulvet mens hun nesten bokstavelig banket fysikken inn i oss. 

Da jeg begynte på UiO visste jeg ikke hva jeg gikk til, bare at jeg likte fysikk så da valgte jeg det.

Jeg ble positivt overrasket gang på gang under studiene, egentlig. Jeg tenkte ikke at programmering var en ting vi skulle drive med, men jeg likte det veldig godt.

Programmering gjorde det mulig å gjøre flere ting raskere. Med bare matematikk får du ut ett svar - “pi halve” - mens med programmering får du feedback med en gang du kjører koden og ser plott.

-Hvorfor ville du ha nettopp denne jobben?

Da jeg begynte å søke jobber tenkte jeg egentlig på utviklerjobber i konsulentselskap. Men etter å ha vært på noen jobbintervjuer begynte jeg å forstå at det ikke var en sånn jobb jeg skulle eller ville ha.

Jeg fant ut at det var data scientist jeg ville jobbe som, og at jeg egentlig ikke hadde så lyst til å jobbe i konsulentfirmaer. De har jo gjerne mange ulike kunder, og på jobbintervjuene fikk jeg vage svar på hva som var aktuelt å jobbe med.

-Ikke søk på drømmejobben først

-Jeg snakket med en rådgiver på UiO om å søke jobb, og han sa “Ikke søk på drømmejobben med en gang; få erfaring fra jobbsøking og intervjuer fra andre jobber først.”

-Det stemte godt for min del, sier Jon Vegard.

Som data scientist må du like å jobbe med mange ulike ting. Spesielt her hos oss i NAV blir det en god del juss.

Jeg liker å jobbe innenfor NAV. Vi jobber for å hjelpe folk å klare seg i livet. Vi er til for innbyggerne. Det tiltaler meg.

NAV har et eget program for nyutdannede.

En gang i måneden omtrent møtes vi til et faglig og sosialt treff. Det kan dreie seg om kurs i programmeringsspråket java eller hvordan gi hverandre tilbakemeldinger, gjerne et foredrag av folk utenfra.

Jeg anbefaler virkelig NAV som arbeidsplass, for alle realister, egentlig. Vi kommer til å få bruk for flere data scientists etterhvert, siden det er mange bruksområder for maskinlæring her.

 

Av Hilde Lynnebakken
Publisert 18. feb. 2020 14:58 - Sist endret 21. feb. 2020 13:13