Course code STIN100

STIN100 Biologisk data-analyse

English course information

Søk etter andre emner

Viser emneinfo for studieåret 2019 - 2020.

Emneansvarlige: Jon Olav Vik, Torgeir Rhodén Hvidsten
Medvirkende: Hilde Vinje, Jon Olav Vik, Simen Rød Sandve
Studiepoeng: 10
Ansvarlig fakultet: Fakultet for kjemi, bioteknologi og matvitenskap
Frekvens: Årlig
Undervises på språk: NO
(NO=norsk, EN=Engelsk)
Begrensning antall plasser:
800
Undervises i periode:
Emnet starter i høstparallellen. Emnet har undervisning/vurdering i høstparallellen.
Første gang: Studieår 2018-2019
Undervises hvor?: Campus Ås
Emnets innhold:
Innen biologen genereres det i økende grad store datasett som ikke kan analyseres manuelt. For å kunne trekke ut ny innsikt fra store datamengder kreves det at moderne biologer har kunnskap og ferdigheter innen programmering og grunnleggende dataanalyse. Dette kurset gir grunnleggende ferdigheter innen programmeringsspråket R og introduserer studentene for vanlige metoder for visualisering og analyse av multidimensjonelle biologiske data. Kurset er organisert rundt veiledet gruppearbeid der studentene analyserer relevante datasett. 
Læringsutbytte:

KUNNSKAPER: Studentene skal få

  • bred kunnskap om grunnleggende behandling, visualisering og analyse av multidimensjonelle biologiske data.
  • kjennskap til hvordan noen viktige datasett innen biologien genereres og hvordan man skal behandle data for å korrigere feilkilder.
  • begrepsapparat om grafiske virkemidler for å framstille data.
  • den kjennskap til programmeringstekniske begreper som er nødvendig for å utføre analysene i kurset.

FERDIGHETER: Studentene skal kunne

  • gjengi og forklare prinsippene bak grunnleggende metoder for visualisering og analyse av data.
  • skrive programmer som utfører grunnleggende databehandling (utvalg, omforming og gruppevise sammendrag) og som tar i bruk enkle visualiserings- og dataanalyse-metoder.
  • generere reproduserbare, kjørbare rapporter der forklarende tekst, programkode og output flettes sammen.
  • tolke resultatene av analysene biologisk.
  • søke effektivt i hjelpetekster, dokumentasjon og i internettressurser for å realisere analyser.
  • forenkle datasett for prototyping og feilsøking av analyser.

GENERELL KOMPETANSE: Studene skal være rustet til å:

  • gripe an datamateriale de møter i senere semesteroppgaver, gradsoppgaver og arbeidsliv.
  • drive etterrettelig analyse der prosesseringen av data er fullt dokumentert gjennom kjørbare rapporter.
  • velge hensiktsmessige virkemidler for visualisering som passer til datatyper og biologisk struktur i dataene.
  • stille oppfølgingsspørsmål til dataanalyser som kan diskuteres med eksperter.
  • lære seg nye metoder og programpakker ut fra dokumentasjon, eksempler og nettressurser.
Læringsaktiviteter:
Noen forelesninger, men hovedvekten blir på praktiske øvelser på datamaskin i grupper.
Læringsstøtte:
Materialet vil bli gjort tilgjengelig i Canvas.
Pensum:
Forelesningsnotater, øvelser og utdelt materiale, samt "R for data science" (https://r4ds.had.co.nz), særlig kapitlene 3 (Data visualisation), 9 (Introduction to data wrangling), 12 (Tidy data), 18 (Pipes), 27 (R markdown).
Obligatorisk aktivitet:
Det vil være obligatoriske oppgaver som studentene må levere og få godkjent for å bli vurdert i emnet.
Vurderingsordning:
Gruppearbeid: Studentene skriver en artikkel basert på analyser av et relevant datasett. Bestått/Ikke bestått.
Sensor:
Ekstern sensor godkjenner opplegg for vurdering.
Merknader:
Studentene må ha egen laptop med Windows, Linux eller macOS.
Normert arbeidsmengde:
Forelesninger: 12 timer. Øvelser: 52 timer. Selvstudium: 236 timer.
Opptakskrav:
MATRS - Generell studiekompetanse + R1 (S1+S2)
Undervisningstid:
2 timer forelesning utvalgte uker (6 uker), 4 timer øvelser per uke på datamaskin.
Eksamensdetaljer: Langsgående vurdering: Bestått / Ikke bestått