BUS255 Introduksjon til dataanalyse i R
Studiepoeng:5
Ansvarlig fakultet:Handelshøyskolen
Emneansvarlig:Ritvana Rrukaj
Campus / nettbasert:Nettbasert
Undervisningens språk:Engelsk
Frekvens:Annual
Forventet arbeidsmengde:125 hours
Undervisnings- og vurderingsperiode:The course starts in the spring parallel. The course has teaching/assessment in the spring parallel, .
Om dette emnet
I dette emnet vil du lære å bruke R til å løse vanlige problemer i dataanalyse. Du vil få grunnleggende kunnskap om datastrukturer, analyse og visualisering.
Noen av nøkkelfordelene ved å jobbe i R er at alt arbeid og analyse er fullt ut reproduserbar, du kan jobbe med store datasett, kontinuerlige datastrømmer, utnytte «state-of-the-art» modellering og data visualiseringsteknikker, og mye mer.
Emnet er delt inn i 4 deler:
- Datautforskning (4 uker)
- Datahåndtering (4 uker)
- Programmering i R (3 uker)
- Modeller i R (2 uker)
Emnet vil dekke følgende temaer:
- Vanlige datastrukturer og datakilder
- Vanlige filformater og dataimportering
- R og R Studio
- Quarto
- Data transformasjon
- Data and model visualization using 'ggplot'
- Exploratory data analysis
- Programming concepts (functions, vectors, and iterations)
- Model building
Dette lærer du
Kunnskap:
- Forstå egenskapene til rådatastrukturer og deres implikasjoner for bruk av analyseteknikker
- Kjenne til de vanligste databasestrukturene og forstå deres implikasjoner for datahåndtering og datauttrekk
- Kjenne til standardteknikker for datatilrettelegging, datatransformasjoner og datautforskning
- Forstå hvordan valg som foretas før analyse, e.g., aggregering og fjerning av observasjoner, påvirker både analyse og tolkning av resultater.
- Forstå hvilke kompromisser som kan være nødvendig i dataanalyseprosessen når man går fra rådata til diskusjon og presentasjon av resultater og hvordan disse kompromissene kan påvirke og føre til skjevhet i resultatene.
- Forstå hvordan programmering kan automatiskere dataanalyseoppgaver, redusere risikoen for feil og øke graden av reproduserbare resultater
Ferdigheter:
- Ha grunnleggende ferdigheter i R og R Studio
- Kunne lese inn data fra ulike datakilder og filformater, e.g., SQL databaser, Excel, XML datastrømmer
- Kunne jobbe med utfordrende rådata og klargjøre disse for analyse
- Kunne utføre grunnleggende former for «feature engineering» som variabelutvelgelse, transformasjoner av data og dataaggregering.
- Kunne lage informative tabeller og visualiseringer av data og analyseresultater
- Kunne lage reproduserbare presentasjoner og rapporter i Quarto
Generell kompetanse:
- Kunne effektivt kommunisere resultatene av dataanalyse ved hjelp av tekst, tabeller og visualiseringer
- Kunne bygge logiske argumenter og begrunne data- og analysevalg
- Kunne stille tekniske spørsmål på en slik måte at andre kan komme inn for å hjelpe til med løsningen
Læringsaktiviteter
Læringsstøtte
Pensum
Forutsatte forkunnskaper
Vurderingsordning, hjelpemiddel og eksamen
Sensorordning
Merknader
Undervisningstider
Overlapp
Opptakskrav