Course code DAT110

DAT110 Innføring i dataanalyse og -visualisering

English course information

Søk etter andre emner

Viser emneinfo for studieåret 2019 - 2020.

Emneansvarlige: Kristin Tøndel
Studiepoeng: 10
Ansvarlig fakultet: Fakultet for realfag og teknologi
Frekvens: Årlig
Undervises på språk: NO
(NO=norsk, EN=Engelsk)
Undervises i periode:
Emnet starter i vårparallellen. Emnet har undervisning/vurdering i vårparallellen.
Første gang: Studieår 2019-2020
Fortrinnsrett: Studenter som tar master i datavitenskap.
Undervises hvor?: Campus Ås
Emnets innhold:
Innføring i grunnleggende dataanalyse med moderne analyseverktøy. Datatyper og innlesing av data fra ulike filformater. Visualisering og eksplorativ analyse for identifikasjon av struktur og trender (histogrammer, scatterplott, box-plott mm). Ulike mål på middeltall og spredning (gjennomsnitt, median, varians mm). Glatting av tidsavhengige data. Korrelasjon og kovarians (på enkeltvariable og data på matriseform). Enkel normalfordelingsteori, normaliserende transformasjoner og test av normalitet. Hypotesetesting (parametriske og ikke-parametriske for undersøkelse av et og to utvalg) og enkel variansanalyse. Minste kvadraters metode (lineære modeller og polynomtilpasninger). Krysstabeller. Klusteranalyse (k-means). Logistisk regresjon (klassifikasjon med to grupper).
Læringsutbytte:
Ferdigeter og innsikt i grunnleggende teknikker for dataanalyse generert via moderne datafangst. Studenten skal lære om hvilke analysemetoder som passer til 1) Eksplorativ dataanlyse (plotting/visualisering og enkle beskrivende statistiske måltall), 2) Hypotestetsting, 3) Korrelasjonsbegrepet, 4) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon (enkel og multippel) og klassifikasjon) og validering av prediktive modeller.  Innføring i klyngeanalyse og glatting av tidsseriedata.
Læringsaktiviteter:
Undervisningen består av forelesninger, og regneøvinger med og uten datamaskin (med bistand fra øvingslærere).
Læringsstøtte:
En hjelpelærer er til stede under alle øvingstimer. Studentene kan utover dette avtale kontakt med ansvarlig lærer på kontoret i treffetiden eller via e-post.
Pensum:
Pensumlitteratur, hjelpelitteratur, pensumoversikt m.m. oppgis på kursets hjemmeside.
Forutsatte forkunnskaper:
Grunnleggende en- og flervariabel analyse samt grunnleggende lineær algebra som er dekket av MATH111 (Kalkulus 1), MATH112 (Kalkulus 2), MATH113 (Lineær algebra og lineære differensiallikninger) eller MATH131 (Lineær algebra).
Anbefalte forkunnskaper:
INF100 Prinsipper i informasjonsbehandling eller tilsvarende.
Obligatorisk aktivitet:
Obligatoriske innleveringsoppgaver. Regler for godkjenning av obligatorisk aktivitet kunngjøres ved kursstart.
Vurderingsordning:

Emnet kan ha fatt ny eksamensform grunnet virusutbruddet. Sjekk i Canvas.

Skriftlig eksamen, 3,5 timer.

Sensor:
Ekstern sensor deltar sammen med intern sensor ved utformingen av eksamensoppgavene og sensorveiledningen. Ekstern sensor kontrollerer intern sensors vurdering av et tilfeldig utvalg kandidater som en kalibrering med visse mellomrom i henhold til instituttets retningslinjer for sensur.
Normert arbeidsmengde:
Undervisning 78 timer, øvelser 26 timer, kollokvier og egenstudier mm: 196 timer.
Opptakskrav:
Realfag
Overlapp:

5 stp med STAT100

10 stp med MATH-INF110

Undervisningstid:
Forelesninger: 4 timer/uke. Øvinger: 8 timer/uke
Eksamensdetaljer: En skriftlig eksamen: A - E / Ikke bestått