STIN100 Biologisk data-analyse

Studiepoeng:10

Ansvarlig fakultet:Fakultet for kjemi, bioteknologi og matvitenskap

Emneansvarlig:Torgeir Rhoden Hvidsten

Campus / nettbasert:Undervises campus Ås

Undervisningens språk:Norsk

Antall plasser:800

Frekvens:Årlig

Forventet arbeidsmengde:Fellesøkter: 54 timer. Øvingstimer: 52 timer. Egenstudium: 144 timer.

Undervisnings- og vurderingsperiode:Emnet starter i høstparallellen. Emnet har undervisning/vurdering i høstparallellen.

Om dette emnet

Innen biologien genereres det i økende grad store datasett som ikke kan analyseres manuelt. For å utvinne kunnskap fra data kreves at biologer har kunnskap og ferdigheter innen programmering og grunnleggende dataanalyse som gjør dem i stand til å utforske, visualisere og tolke data. Dette må gjøres på en etterprøvbar måte der det framgår hvordan dataene er prosessert, så man lett kan gjøre alternative analyser om ønskelig.

Dette kurset gir grunnleggende ferdigheter innen programmeringsspråket R og introduserer studentene for vanlige metoder for visualisering og analyse av multidimensjonelle, biologiske data. Kurset er organisert rundt veiledet gruppearbeid der studentene analyserer relevante datasett. De lærer "lesbar programmering", en sømløs blanding av dataprogramkode og fri, forklarende tekst, som kan veves sammen med output av programmet til en selvdokumenterende, etterprøvbar rapport.

I en tid der tilliten til vitenskapelig kunnskap svekkes, samtidig som bærekraftsutfordringene står i kø, er dataforståelse og etterprøvbar kunnskapsproduksjon avgjørende. STIN100 gjør at framtidige arbeidsgivere og beslutningstakere kan ha tillit til kunnskapsgrunnlaget studenten leverer.

Dette lærer du

KUNNSKAPER: Studentene skal få

  • bred kunnskap om grunnleggende behandling, visualisering og analyse av multidimensjonelle biologiske data.
  • kjennskap til hvordan noen viktige datasett innen biologien genereres og hvordan man skal behandle data for å korrigere feilkilder.
  • begrepsapparat om grafiske virkemidler for å framstille data.
  • den kjennskap til programmeringstekniske begreper som er nødvendig for å utføre analysene i kurset.

FERDIGHETER: Studentene skal kunne

  • gjengi og forklare prinsippene bak grunnleggende metoder for visualisering og analyse av data.
  • skrive programmer som utfører grunnleggende databehandling (utvalg, omforming og gruppevise sammendrag) og som tar i bruk enkle visualiserings- og dataanalyse-metoder.
  • generere reproduserbare, kjørbare rapporter der forklarende tekst, programkode og output flettes sammen.
  • tolke resultatene av analysene biologisk.
  • søke effektivt i hjelpetekster, dokumentasjon og i internettressurser for å realisere analyser.
  • forenkle datasett for prototyping og feilsøking av analyser.

GENERELL KOMPETANSE: Studentene skal være rustet til å:

  • gripe an datamateriale de møter i senere semesteroppgaver, gradsoppgaver og arbeidsliv.
  • drive etterrettelig analyse der prosesseringen av data er fullt dokumentert gjennom kjørbare rapporter.
  • velge hensiktsmessige virkemidler for visualisering som passer til datatyper og biologisk struktur i dataene.
  • stille oppfølgingsspørsmål til dataanalyser som kan diskuteres med eksperter.
  • lære seg nye metoder og programpakker ut fra dokumentasjon, eksempler og nettressurser.
  • Læringsaktiviteter

    To dobbelttimer med fellesøkter per uke: en blanding av forelesning og aktiv læring med hjelpelærere tilgjengelige (4 timer). To dobbelttimer med øving på datamaskin per uke: studentene arbeider på egen hånd, alene eller i par med hjelpelærere tilgjengelige (4 timer).

    Læringsfilosofien i kurset er: Aktiv læring, ved at du programmerer selv og formulerer hva dataene forteller. Problembasert læring, rundt NMBU-relevante forskningsspørsmål. Samarbeidslæring, gjennom parprogrammering. Studentdrevet læring der du selv velger hva du vil øve mer på.

  • Læringsstøtte

    Canvas inneholder ukeplaner med lenker til læringsstoff, øvingsoppgaver og andre innleveringer.

    Hjelpelærere er tilgjengelige for spørsmål i felles- og øvingstimene. Ellers besvares spørsmål om dataanalyse og programmering i Diskusjoner i Canvas. Å stille effektive spørsmål gjennom reproduserbart eksempel er en nøkkelferdighet som dere vil lære i løpet av kurset.

    Innleveringene får tilbakemeldinger fra hjelpelærere (i noen tilfeller får dere automatiske tilbakemeldinger).

  • Pensum
    Læringsstoff gjort tilgjengelig via Canvas, øvingsoppgaver og andre innleveringer, samt utvalgte deler av gratisbøkene Hands-on programming with R og R for data science.
  • Anbefalte forkunnskaper

    Må jeg kunne mye matematikk? Biologi? Datavitenskap?

    Du trenger verken kunne mye matematikk, biologi eller datavitenskap for å ta kurset, men du må kjenne filsystemet, tastaturet, nettleseren og datamaskinen din! For noen krever dette mye jobbing, spesielt den første uka.

  • Vurderingsordning, hjelpemiddel og eksamen

    Vurdering er bestått/ikke bestått basert på en rekke godkjente innlevering gjennom semesteret. Hvis en oppgave ikke blir godkjent, gis konkret veiledning og ett ekstra forsøk.

    Godkjente innleveringer gjelder kun innenfor det pågående semesteret.



    Mappevurdering Karakterregel: Bestått/ Ikke bestått
  • Sensorordning
    Ekstern sensor godkjenner opplegg for vurdering.
  • Merknader
    Studentene må ha egen laptop med Windows, Linux eller macOS som kan kjøre RStudio (se oppdaterte systemkrav). Chromebook dekker ikke systemkravene for programmene vi bruker.
  • Undervisningstider

    2 dobbelttime fellesøkt per uke.

    2 dobbelttimer øving per uke.

  • Opptakskrav
    MATRS - Generell studiekompetanse + R1 (S1+S2)