STK2100 – Maskinl?ring og statistiske metoder for prediksjon og klassifikasjon
Beskrivelse av emnet
Kort om emnet
STK2100 gir innf?ring i ulike metoder for styrt l?ring (regresjon og klassifikasjon). Emnet inneholder b?de modell- og algoritme-baserte tiln?rminger. Hovedvekten vil v?re p? styrt l?ring, men ogs? ikke-styrte metoder som klustring vil bli omtalt.?Emnet omhandler ogs? problematikk knyttet til store datamengder.
Emnet gir et godt grunnlag for videre studier i statistikk eller Data Science, men er ogs? nyttig for studenter som har behov for ? gj?re dataanalyser i andre fagomr?der.
Hva l?rer du?
Etter ? ha fullf?rt emnet:
- kan du de fundamentale prinsipper for styrt l?ring (regresjon og klassifikasjon) samt hvordan en kan evaluere ulike metoder
- behersker du mange ulike metoder for styrt l?ring, inkludert line?re modeller, logistisk regresjon, trebaserte metoder, bootstrapping og andre simuleringsbaserte metoder, dimensjons-reduksjon og regularisering, bagging og boosting samt support vector machines
- har du kunnskap om problematikk knyttet til h?ydimensjonale data
- har du kjennskap til problemer knyttet til store datamengder og til metoder for ikke-styrt l?ring
Opptak til emnet
Studenter m? hvert semester?s?ke og f? plass p? undervisningen og melde seg til eksamen?i Studentweb.
Spesielle opptakskrav
I tillegg til?generell studiekompetanse?eller?realkompetanse?m? du dekke spesielle opptakskrav.
Du m? ha:
Matematikk R1 (eller Matematikk S1 og S2) + R2
Og en av disse:
Fysikk (1+2)
Kjemi (1+2)
Biologi (1+2)
Informasjonsteknologi (1+2)
Geofag (1+2)
Teknologi og forskningsl?re (1+2)
De spesielle opptakskravene kan ogs? dekkes med?fag fra videreg?ende oppl?ring f?r Kunnskapsl?ftet, eller p? andre m?ter.
Anbefalte forkunnskaper
- STK1100 – Sannsynlighetsregning og statistisk modellering eller STK-FYS1110 – Sannsynlighetsregning, modellering og dataanalyse for de fysiske fagene
- MAT1100 – Kalkulus
- MAT1110 – Kalkulus og line?r algebra
- MAT1120 – Line?r algebra
- MAT1125 – Videreg?ende line?r algebra
- IN1900 – Introduksjon i programmering for naturvitenskapelige anvendelser
Overlappende emner
- 7 studiepoeng overlapp med STK4030 – Statistisk l?ring: Videreg?ende regresjon og klassifikasjon (nedlagt).
Undervisning
3 timer forelesning og 2 timer regne?velse hver uke hele semesteret.
Eksamen
Avsluttende skriftlig eksamen som teller 100 % ved sensurering.