Sammenligning av metoder for genomisk prediksjon

Genomisk seleksjon er bruk av DNA-informasjon for å regne ut en avlsverdi for å velge ut hvilke dyr som er best å bruke i avl. Genomisk seleksjon har revolusjonert husdyravlen siden tidlig 2000-tallet da den gir en høyere sikkerhet på avlsverdiene sammenlignet med tidligere metoder som baserer seg på dyrenes stamtavleinformasjon. Etter hvert som teknologien for genotyping har utviklet seg og prisene synker har også tettheten av markører på DNA-et (genomet) blitt høyere og disse genotypene mer tilgjengelige. Sikkerheten på prediksjonene av avlsverdiene har økt med dagens metoder opp til et visst nivå av tetthet, men det er et behov for å finne nye metoder som bedre kan utnytte høy-tetthets og hel-genom sekvens data.

Hovedmålet med denne oppgaven var å undersøke genomiske prediksjonsmetoder for genotyper med høy markørtetthet og hel-genom sekvens, med vekt på egenskaper som kan ha vanskeligheter med å oppnå høy prediksjonsnøyaktighet med stamtavlebaserte prediksjoner, som for eksempel sykdomsresistens og maternale egenskaper. En Bayesiansk seleksjonsmetode som kombinerer et polygent element via en G-matrise og et BayesC-element (BayesGC) ble sammenlignet med Genomic Best Linear Unbiased Prediction (GBLUP), og BayesC.

BayesGC har en liten fordel fremfor GBLUP

Totalt sett viste studiene at BayesGC så ut til å ha en liten fordel fremfor GBLUP, spesielt med store datasett, genotyper med høy tetthet og når forholdet mellom referanse- og valideringsdyrene var lavere. De viste også at forholdet mellom dyrene i referanse- og valideringspopulasjonen, og størrelsen på referansepopulasjonen, hadde en mer signifikant innvirkning på prediksjonsnøyaktigheten enn prediksjonsmetoden.

Når man beregner avlsverdi med høy-tetthet og hel-genom sekvens data er det en fordel med en stor referansepopulasjon både på tvers og innenfor rase. Om man kombinerer flere raser i referansepopulasjonen er det viktigere å ha større andel av den samme rasen man ønsker å predikere enn det er med mange dyr av en annen rase.

Selv om GBLUP, BayesC og BayesGC hadde liknende nøyaktighet på prediksjon av avlsverdi var sikkerheten for BayesGC generelt lik eller høyere sikkerhet enn GBLUP som er en av de mest brukte metodene i dag. Innenfor BayesGC metoden kunne sikkerheten variere avhengig av hvilke parametere man bestemte på forhånd.

─ BayesGC metoden hadde spesielt utnytte av stor referansepopulasjon og var mindre avhengig av de ulike typene av genotypedata for å oppnå en høy prediksjonssikkerhet, sier Kjetså .

Forbedrede metoder utvikler avlsarbeidet på husdyr

Det kan ofte være vanskeligere å oppnå en høy sikkerhet på beregning av avlsverdier for sykdomsegenskaper og maternale egenskaper (egenskaper som kun kan måles på moren).  Ved å forbedre metoder for å beregne avlsverdier kan man oppnå en større fremgang i avlen for disse egenskapene og dermed forbedre dyrevelferden med å avle frem friskere dyr og mødre som tar godt vare på avkommene sine.

I en større sammenheng så bidrar dette forskningsarbeidet til å velge hvilke metoder man bruker eller eventuelt ikke bruker videre for å beregne avlsverdier. Metodene i denne oppgaven oppnådde ikke nødvendigvis en revolusjonerende nyhet men det er et lite bidrag i den store sammenhengen med å finne nye metoder som kan utnytte informasjonen man har tilgjengelig med utvikling av teknologien for DNA kartlegging.

Maria Valkeneer Kjetså forsvarer sin avhandling «Genomisk prediksjon ved bruk av høy tetthets- og hel-genom sekvens genotyper» ved NMBU 15. juni 2022.

Published 13. juni 2022 - 12:55 - Updated 13. juni 2022 - 13:03