Kunstig intelligens

Hva er KI?

Kunstig intelligens kan ta mange ulike former avhengig av hvilke oppgaver den er utviklet for å utføre. Mange KI-verktøy er eksempelvis laget for å behandle større datasett eller løse matematiske og/eller statistiske problemer. Denne type programmer er godt etablert og benyttes flittig i forskning, inkludert ved NMBU. Relativt nytt er imidlertid KI som kan etterlikne måten mennesker snakker og skriver på. Dette kalles en Språkmodell – og er et statistisk verktøy som kan forutsi neste ord i en gitt sekvens. Det er med andre ord kontekstbestemt sannsynlighetsfordeling av ord. Den mest kjente Språkmodellen er Chat GPT – Generative Pre-trained Transformer. Som navnet tilsier, er GPT trent på store mengder data (tekst) for å kunne generere tekst på en menneskeliknende måte ved å svare på spørsmål fra brukeren. Den er utelukkende trent på data fra september 2021 og bakover. Den er heller ikke på internett og kan derfor ikke oppdatere seg selv på det som har skjedd etter 2021. Totalt utgjør tekstmengden den er trent på 45 terabyte. De andre Språkmodellene som finnes er trent på samme måte. Det er svært mange å velge mellom, men dette er de mest populære per i dag (mai 2023):

  • The new Bing
  • ChatGPT
  • Google Bard
  • YouChat
  • Jasper
  • Socratic
  • Chatsonic

Flere av disse bruker teknologien til Open AI (GPT), og noen har også tilgang på internett. Et eksempel er The new Bing, der chat funksjonen er basert på ChatGPT 4, men den kan også søke på internett for å generere mest mulig treffsikre svar.

Treffsikkerhet - sannsynlighet ikke skjønn

Det ligger i en språkmodells natur å generere feilaktig informasjon. Den kan ikke skille rett og galt på egenhånd og komponerer dermed setninger basert på sannsynlighet, ikke skjønn. Her er et eksempel:

ChatGPT ble stilt spørsmålet om hva som er tidenes mest siterte forskningsartikkel i økonomi. Svaret var “A Theory of Economic History” – skrevet av Douglass North i 1969 og publisert i Journal of Economic History. Problemet er bare at denne artikkelen ikke finnes. Ved å søke i egen treningsdata setter den sammen de ordene som oftest opptrer sammen basert på spørsmålet:

Bilde

Bildet er hentet fra: https://twitter.com/dsmerdon/status/1618817510987669504
 

«A Theory of Economic History” er da svaret vi får servert av ChatGPT. Valg av forfatter er gjort på samme måte. Douglass North er den forfatteren som har publisert mest innen økonomi. Sannsynlighet tilsier derfor at han er forfatteren.

GPT og de andre språkmodellene har også innprogrammerte etiske retningslinjer. De handler i hovedsak om støtende innhold og personvern, men de er også påvirket av politiske synspunkter dominerende i de amerikanske tech-selskapene. Språkmodellene har derfor en innebygget bias. Dette er med på å påvirke treffsikkerheten.

ChatGPT som kilde

Selv om flere individuelle brukere stiller samme spørsmål til chatGPT, vil ikke det genererte svaret være likt. Det vil ha likheter, men hvert svar er allikevel unikt. KI-generert tekst vil derfor per i dag ikke slå ut i en plagieringssjekk ved bruk av Ouriginal. Det finnes imidlertid flere leverandører av slik programvare, der noen også tilbyr «KI-sjekk». Det er også viktig å poengtere at GPT o.l. ikke kan refereres til som en kilde. Dette er fordi språkmodellene svarer ved å lete i og kombinere elementer fra egen treningsdata. Kildene er heller ikke lagt ved med mindre man spør eksplisitt om det. Som tidligere nevnt kan den også selv generere og henvise til kilder som ikke finnes. Hvis innlevert tekst inneholder slike kilder vil Ouriginal kunne oppdage det.

Annullering av emne og vitnemål

  • Selv om språkmodeller som ChatGPT evt. ikke nevnes eksplisitt i retningslinjene for eksamen, så fremgår det veldig klart at besvarelsene skal være ditt eget arbeid.

  • Kopierer du tekst fra andre kilder, får andre til å skrive teksten for deg, eller du benytter f. eks Chat GPT eller annen KI regnes dette som forsøk på fusk. Resultatet kan bli annullering av eksamen/emne samt utestenging fra universitet. 

Sammen med utviklingen av KI kommer også tjenester som kan brukes til å avdekke bruk av KI. Det betyr blant annet at hvis du som student våren 2023 bruker KI til hele/deler av besvarelsen din vil besvarelsen/eksamen kunne bli annullert når rett verktøy blir tilgjengelig i fremtiden. Dette kan også medføre at vitenmålet ditt blir kanselert. Adgangen til annullering foreldes ikke jf. universitets- og høyskoleloven § 4-7 (4). 

NMBUs regelverk for fusk

NMBUs nåværende regelverk for fusk er inntil videre dekkende for bruk av KI-verktøy som ChatGPT.

Følgende punkter er mest treffende:

 3.1 Fusk er enhver handling som sikter mot å gi studenten et uberettiget studieresultat eller et uberettiget fortrinn ved evaluering av studieprestasjon.

3.2 a. Brudd på eksamensforskrifter ved NMBU kan være fusk.

Å benytte en språkmodell for å generere tekst kan per i dag defineres som en måte å skaffe seg et «uberettiget fortinn» på ved evaluering av studieprestasjon. Man må benytte seg av selvstendig programvare (med innlogging) som ikke inngår i NMBUs liste over godkjente digitale verktøy.

3.2 g. Plagiat er fusk. Eksempler på plagiering: Gjengivelse eller sitater fra bøker, artikler, internettsider, egne eller andres oppgaver, bruk av bilder, grafer o.l. uten kildehenvisning, sitattegn eller annen tilkjennegivelse i teksten/bildet/tegningen som viser hvor materialet er hentet fra.

Datalagring og personopplysninger

Majoriteten av selskapene som eier og utvikler de store språkmodellene lagrer brukerdata i USA. De krever innlogging ved oppretting av passord, registrering av telefonnummer og/eller epost (alternativ via Facebook eller en Microsoft-konto), men lagrer også metadata som din internetthistorikk, browser-type og hvilke innhold du søker etter og eksponeres for ved bruk av programmet. I tillegg vil enkelte av språkmodellene trenes ytterligere ved at du interagerer med dem. Alt du skriver, og alle svar du får blir brukt for å utvikle teknologien ytterligere. På grunnlag av reguleringer vedrørende datalagring utenfor EU (GDPR), kan ikke NMBU eller ansatte ved NMBU pålegge studentene å benytte slike verktøy som del av undervisningen. Dette er imidlertid noe tech-selskapene er klar over og ønsker å imøtekomme ved å endre egen datalagringspraksis.

Videre utvikling av KI

Flere og flere selskaper innlemmer KI i sine produkter. Dette gjelder alt fra sosiale medier til programmer for tekstproduksjon. Microsoft har et offisielt samarbeid med OpenAI (utvikleren av ChatGPT) om integrasjon av KI-teknologi i sin programvare, inkludert Office. Dette betyr at vi sannsynligvis vil se GPT-liknende funksjoner i Word, PowerPoint, Outlook, Excel etc. siden Office-pakken tilbys alle studenter i Norge er det i dag uklart hvorvidt bruk av KI for tekstproduksjon vil bli betraktet som «et uberettiget fortrinn» eller ikke.

 

Published 11. mai 2023 - 13:20 - Updated 23. mai 2023 - 16:38