BUS255 Introduksjon til dataanalyse i R

Studiepoeng:5

Ansvarlig fakultet:Handelshøyskolen

Emneansvarlig:Ritvana Rrukaj

Campus / nettbasert:Nettbasert

Undervisningens språk:Engelsk

Frekvens:Annual

Forventet arbeidsmengde:125 hours

Undervisnings- og vurderingsperiode:The course starts in the spring parallel. The course has teaching/assessment in the spring parallel, .

Om dette emnet

I dette emnet vil du lære å bruke R til å løse vanlige problemer i dataanalyse. Du vil få grunnleggende kunnskap om datastrukturer, analyse og visualisering.

Noen av nøkkelfordelene ved å jobbe i R er at alt arbeid og analyse er fullt ut reproduserbar, du kan jobbe med store datasett, kontinuerlige datastrømmer, utnytte «state-of-the-art» modellering og data visualiseringsteknikker, og mye mer.

Emnet er delt inn i 4 deler:

  1. Datautforskning (4 uker)
  2. Datahåndtering (4 uker)
  3. Programmering i R (3 uker)
  4. Modeller i R (2 uker)

Emnet vil dekke følgende temaer:

  • Vanlige datastrukturer og datakilder
  • Vanlige filformater og dataimportering
  • R og R Studio
  • Quarto
  • Data transformasjon
  • Data and model visualization using 'ggplot'
  • Exploratory data analysis
  • Programming concepts (functions, vectors, and iterations)
  • Model building

Dette lærer du

Kunnskap:

  • Forstå egenskapene til rådatastrukturer og deres implikasjoner for bruk av analyseteknikker
  • Kjenne til de vanligste databasestrukturene og forstå deres implikasjoner for datahåndtering og datauttrekk
  • Kjenne til standardteknikker for datatilrettelegging, datatransformasjoner og datautforskning
  • Forstå hvordan valg som foretas før analyse, e.g., aggregering og fjerning av observasjoner, påvirker både analyse og tolkning av resultater.
  • Forstå hvilke kompromisser som kan være nødvendig i dataanalyseprosessen når man går fra rådata til diskusjon og presentasjon av resultater og hvordan disse kompromissene kan påvirke og føre til skjevhet i resultatene.
  • Forstå hvordan programmering kan automatiskere dataanalyseoppgaver, redusere risikoen for feil og øke graden av reproduserbare resultater

Ferdigheter:

  • Ha grunnleggende ferdigheter i R og R Studio
  • Kunne lese inn data fra ulike datakilder og filformater, e.g., SQL databaser, Excel, XML datastrømmer
  • Kunne jobbe med utfordrende rådata og klargjøre disse for analyse
  • Kunne utføre grunnleggende former for «feature engineering» som variabelutvelgelse, transformasjoner av data og dataaggregering.
  • Kunne lage informative tabeller og visualiseringer av data og analyseresultater
  • Kunne lage reproduserbare presentasjoner og rapporter i Quarto

Generell kompetanse:

  • Kunne effektivt kommunisere resultatene av dataanalyse ved hjelp av tekst, tabeller og visualiseringer
  • Kunne bygge logiske argumenter og begrunne data- og analysevalg
  • Kunne stille tekniske spørsmål på en slik måte at andre kan komme inn for å hjelpe til med løsningen
  • Læringsaktiviteter
    "Flipped classroom" with pre-recorded videos and resources available on Canvas. Weekly campus-based and/or online seminars.
  • Læringsstøtte

    A FAQ is prepared that is available on Canvas. Online forums such as "Stack Overflow" can be used to learn from existing questions and answers, and to ask questions in a way that others can help.

    Weekly automatically marked problem sets to help students review the material are available on Canvas.

  • Pensum

    R for Data Science by Hadley Wickham & Garrett Grolemund (Open Access)

    Additional reading material will be made available on Canvas

  • Forutsatte forkunnskaper
    STAT100 or equivalent. Given the structure of the course, BUS255 can be taken at the same time as STAT100.
  • Vurderingsordning, hjelpemiddel og eksamen
    Portfolio assessment consisting of 2 assignments.

    Mappe/sammensatt vurdering Karakterregel: Bestått/ Ikke bestått
  • Sensorordning
    External examiners quality assure the syllabus, exam questions and principles for evaluation and answers.
  • Merknader
    There is a master's version of this course with the course code BUS350 that is given in the autumn parallel.
  • Undervisningstider
    • Lectures as pre-recorded videos, approx. 18 hours
    • Exercises - either on campus or digitally, 2 hours per week in the semester, about 26 hours. It is possible to participate in several exercises per week if desired
  • Overlapp
    The course overlaps 5 credits with BUS350 and 5 credits with STIN300
  • Opptakskrav
    General University Admission Competence (GSK). This course is for bachelor students at NMBU. Students who do not have the right to study the course can contact the student advisors at the School of Business and Law (studieveileder-hh@nmbu.no).