Detaljer om emnet DAT200

DAT200 Anvendt maskinlæring

English course Information

Søk etter andre emner

Viser emnet slik det undervises i studieåret med start i 2017 .

Emneansvarlige: Oliver Tomic, Kristian Hovde Liland
Medvirkende: Kristin Tøndel, Ulf Geir Indahl
Studiepoeng: 10
Ansvarlig fakultet: Fakultet for realfag og teknologi
Frekvens: Årlig
Undervises på språk: EN
(NO=norsk, EN=Engelsk)
Undervises i periode:

Emnet starter i vårparallellen.

Emnet har undervisning/vurdering i vårparallellen.

Første gang: Studieår 2017-2018
Emnets innhold:

Innføring i grunnleggende maskinlæringsmetodikk med moderne, beregningskraftige dataverktøy. Metodikken som dekkes omfatter:

  • preprosessering og tilrettelegging av data: visualisering, outlier detection, skalering, formatering av datatyper
  • klustring: K-means, DB-scan, hierarchical trees, PCA
  • klassifikasjon: KNN, logistisk regresjon, LDA, SVM, decision trees
  • regresjon: OLS, regularisering, polynomisk regresjon, trebaserte metoder, PCR, PLS
  • ulike kriterier for modellutvelgelse

Kurset gir en innføring i metodenes grunnleggende teoretiske egenskaper, men har hovedfokus på anvendt modellering med reelle datasett.

Læringsutbytte:

Ferdigheter og innsikt i grunnleggende teknikker for maskinlæring generert via moderne datafangst. Grunnleggende forståelse av ulike modellers matematiske egenskaper og virkemåte. Studenten lærer seg å beherske analysemetoder som passer til 1) Eksplorativ dataanalyse (diagnose og visualisering), 2) Forbehandling av data fra varierende kilder, 3) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon og klassifikasjon) og validering av prediktive modeller.

Studentene lærer å koble ulike problemstillinger til valg av hensiktsmessig analysemetodikk.

Læringsaktiviteter:
Undervisningen består av forelesninger og praktiske øvelser med bruk av datamaskin og moderne maskinlæringsprogramvare (med bistand fra øvingslærere).
Læringsstøtte:

Maskinlæring er et fagområde i konstant utvikling, og læringsstøtteressurser på internett vil knyttes opp mot forelesninger og oppgaver via kurshjemmesidene i Canvas.

Studentene kan utover dette avtale kontakt med ansvarlig lærer på kontoret i treffetiden eller via epost.

Pensum:
Pensumlitteratur, programvare, hjelpelitteratur, pensumoversikt m.m. oppgis på kursets hjemmeside.
Forutsatte forkunnskaper:

MATH-INF110, alternativt STAT100 eller tilsvarende.

MATH113/MATH131 eller tilsvarende grunnleggende lineær algebra

INF120 eller et tilsvarende emne i grunnleggende programmering.

Anbefalte forkunnskaper:
Obligatorisk aktivitet:
Obligatoriske innleveringsoppgaver. Regler for godkjenning av obligatorisk aktivitet kunngjøres ved kursstart.
Vurderingsordning:
Skriftlig eksamen, 3,5 timer.
Sensor:
Ekstern sensor deltar sammen med intern sensor ved utformingen av eksamensoppgavene og sensorveiledningen. Ekstern sensor kontrollerer intern sensors vurdering av et tilfeldig utvalg kandidater som en kalibrering med visse mellomrom i henhold til fakultetets retningslinjer for sensur.
Normert arbeidsmengde:
Undervisning 78 timer, øvelser 26 timer, kollokvier og egenstudier mm: 196 timer.
Undervisningstid:
Forelesninger: 4 timer/uke. Øvinger: 2 timer/uke.
Eksamensdetaljer: En skriftlig eksamen: A - E / Ikke bestått