Detaljer om emnet STIN100

STIN100 Biologisk data-analyse

Emnet kan ha endringer på grunn av koronautbruddet. Sjekk Canvas og studentWeb.

English course Information

Søk etter andre emner

Viser emnet slik det undervises i studieåret med start i 2020 .

Emneansvarlige: Jon Olav Vik, Torgeir Rhodén Hvidsten
Medvirkende: Hilde Vinje, Jon Olav Vik, Simen Rød Sandve, Kathrine Frey Frøslie
Studiepoeng: 10
Ansvarlig fakultet: Fakultet for kjemi, bioteknologi og matvitenskap
Frekvens: Årlig
Undervises på språk: NO
(NO=norsk, EN=Engelsk)
Begrensning antall plasser:
800
Undervises i periode:
Emnet starter i høstparallellen. Emnet har undervisning/vurdering i høstparallellen.
Første gang: Studieår 2018-2019
Emnets innhold:

Innen biologien genereres det i økende grad store datasett som ikke kan analyseres manuelt. For å utvinne kunnskap fra data kreves at biologer har kunnskap og ferdigheter innen programmering og grunnleggende dataanalyse som gjør dem i stand til å utforske, visualisere og tolke data. Dette må gjøres på en etterprøvbar måte der det framgår hvordan dataene er prosessert, så man lett kan gjøre alternative analyser om ønskelig.

Dette kurset gir grunnleggende ferdigheter innen programmeringsspråket R og introduserer studentene for vanlige metoder for visualisering og analyse av multidimensjonelle biologiske data. Kurset er organisert rundt veiledet gruppearbeid der studentene analyserer relevante datasett. De lærer "lesbar programmering", en sømløs blanding av dataprogramkode og fri, forklarende tekst, som kan veves sammen med output av programmet til en selvdokumenterende, etterprøvbar rapport.

I en tid der tilliten til vitenskapelig kunnskap svekkes, samtidig som bærekraftsutfordringene står i kø, er dataforståelse og etterprøvbar kunnskapsproduksjon avgjørende. STIN100 gjør at framtidige arbeidsgivere og beslutningstakere kan ha tillit til kunnskapsgrunnlaget studenten leverer.

Læringsutbytte:

KUNNSKAPER: Studentene skal få

  • bred kunnskap om grunnleggende behandling, visualisering og analyse av multidimensjonelle biologiske data.
  • kjennskap til hvordan noen viktige datasett innen biologien genereres og hvordan man skal behandle data for å korrigere feilkilder.
  • begrepsapparat om grafiske virkemidler for å framstille data.
  • den kjennskap til programmeringstekniske begreper som er nødvendig for å utføre analysene i kurset.

FERDIGHETER: Studentene skal kunne

  • gjengi og forklare prinsippene bak grunnleggende metoder for visualisering og analyse av data.
  • skrive programmer som utfører grunnleggende databehandling (utvalg, omforming og gruppevise sammendrag) og som tar i bruk enkle visualiserings- og dataanalyse-metoder.
  • generere reproduserbare, kjørbare rapporter der forklarende tekst, programkode og output flettes sammen.
  • tolke resultatene av analysene biologisk.
  • søke effektivt i hjelpetekster, dokumentasjon og i internettressurser for å realisere analyser.
  • forenkle datasett for prototyping og feilsøking av analyser.

GENERELL KOMPETANSE: Studene skal være rustet til å:

  • gripe an datamateriale de møter i senere semesteroppgaver, gradsoppgaver og arbeidsliv.
  • drive etterrettelig analyse der prosesseringen av data er fullt dokumentert gjennom kjørbare rapporter.
  • velge hensiktsmessige virkemidler for visualisering som passer til datatyper og biologisk struktur i dataene.
  • stille oppfølgingsspørsmål til dataanalyser som kan diskuteres med eksperter.
  • lære seg nye metoder og programpakker ut fra dokumentasjon, eksempler og nettressurser.
Læringsaktiviteter:
Noen forelesninger, men hovedvekten blir på praktiske øvelser på datamaskin i grupper.
Læringsstøtte:
Læringsmateriale tilpasset NMBU-studier finnes i Canvas. Videre bruker vi gratis lærebøker fra internett, se Pensum.
Pensum:
Forelesningsnotater, øvelser og utdelt materiale, samt utvalgte deler av "Hands-on programming with R" (https://rstudio-education.github.io/hopr/) og "R for data science" (https://r4ds.had.co.nz) særlig kapitlene 3 (Data visualisation), 9 (Introduction to data wrangling), 12 (Tidy data), 18 (Pipes), 27 (R markdown)).
Anbefalte forkunnskaper:
Obligatorisk aktivitet:
Det vil være obligatoriske oppgaver som studentene må levere og få godkjent for å bli vurdert i emnet.
Vurderingsordning:
Gruppearbeid: Studentene skriver en artikkel basert på analyser av et relevant datasett. Bestått/Ikke bestått.
Sensor:
Ekstern sensor godkjenner opplegg for vurdering.
Merknader:
Studentene må ha egen laptop med Windows, Linux eller macOS.
Normert arbeidsmengde:
Forelesninger ispedd øvelser: 64 timer. Selvstudium: 236 timer.
Opptakskrav:
MATRS - Generell studiekompetanse + R1 (S1+S2)
Undervisningstid:

Fire uker: 2 timer forelesning ispedd øvelser på datamaskin, 4 timer øvelser på datamaskin med foreleser og hjelpelærere til stede.

Tre dobbelt-uker: 1 time gjesteforelesning om utvalgte datasett, 1 time om relaterte programmerings- og analyseteknikker, 10 timer analyse og rapportskriving på datamaskin med foreleser og hjelpelærere til stede.

Tre uker: 6 timer analyse og rapportskriving på datamaskin med foreleser og hjelpelærere til stede.

Eksamensdetaljer: Langsgående vurdering: Bestått / Ikke bestått