DAT110 Innføring i dataanalyse og -visualisering
Studiepoeng:10
Ansvarlig fakultet:Fakultet for realfag og teknologi
Emneansvarlig:Ulf Geir Indahl
Campus / nettbasert:Undervises campus Ås
Undervisningens språk:Engelsk, norsk
Frekvens:Årlig
Forventet arbeidsmengde:Undervisning 80 timer, øvinger 30 timer, obligatoriske oppgaver og egenstudier minimum 140 timer.
Undervisnings- og vurderingsperiode:Emnet starter i vårparallellen. Emnet har undervisning/vurdering i vårparallellen.
Om dette emnet
Innføring i grunnleggende dataanalyse med moderne analyseverktøy
Pensum - inkludert programmering av all analysemetodikk:
- Datatyper og innlesing av data fra ulike filformater.
- Visualisering og eksplorativ analyse for identifikasjon av struktur og trender (histogrammer, scatterplott, box-plott m.m.).
- Ulike mål på middeltall og spredning (gjennomsnitt, median, varians m.m.).
- Korrelasjon og kovarians (på enkeltvariable og data på matriseform).
- Krysstabeller.
- Enkel normalfordelingsteori, normaliserende transformasjoner og test av normalitet.
- Geometriske fordelinger, binomiske fordelinger, Poisson-fordelinger.
- Inferens (parametriske og ikke-parametriske for undersøkelse av ett og to utvalg) og enkel variansanalyse.
- Minste kvadraters metode (lineære modeller og polynomtilpasninger)
- Logistisk regresjon (klassifikasjon med to grupper).
Demonstrasjon:
- Klusteranalyse (k-means, hierarkisk klusteranalyse m.m.).
Dette lærer du
Ferdigheter og innsikt i grunnleggende teknikker for dataanalyse generert via moderne datafangst. I tillegg vil fokus gies til ferdigheter som er relevant for arbeidslivet som gruppearbeid og presentasjoner.
Studenten skal lære om hvilke analysemetoder som passer til
1) Eksplorativ dataanalyse (plotting/visualisering og enkle beskrivende statistiske måltall),
2) Visualisering,
3) Inferens,
4) Modellering og prediksjon med kontinuerlige og kategoriske responser (regresjon (enkel og multippel) og klassifikasjon) og validering av prediktive modeller.
5) Innføring i klusteranalyse og glatting av tidsseriedata.
Læringsaktiviteter
Læringsstøtte
Pensum
Forutsatte forkunnskaper
Anbefalte forkunnskaper
Vurderingsordning, hjelpemiddel og eksamen
Sensorordning
Obligatorisk aktivitet
Undervisningstider
Overlapp
Opptakskrav