Kronikk

Hva hvis Trump får kloa i superintelligent KI?

Aksel Braanen Sterri

Først publisert i:

Dagsavisen

Ingen ønsker at Kina skal vinne KI-kappløpet. Men hvor trygge er vi om Donald Trumps USA kommer først i mål?

Last ned

KI-generert illustrasjon fra Sora

Hovedmomenter

Innhold

Ifølge et nytt notat, kalt AI 2027, kan de ledende KI-labene lage superintelligente KI-systemer i løpet av de neste årene. Dette er i tråd med hva Sam Altman og Dario Amodei, lederne av de fremste KI-selskapene, lover. Men der Altman og Amodei tror superintelligente KI-systemer vil kunne forbedre menneskeheten, forteller AI 2027 en annen historie.

Hvis labene greier å styre teknologien, vil det gi Donald Trump, Xi Jinping eller begge tilgang på historiens kraftigste verktøy. Mer sannsynlig, mener forfatterne, skaper selskapene en aktør de ikke greier å kontrollere – noe som vil føre til menneskehetens utslettelse.

Spådommene høres ut som science fiction, men forfatterne er ikke hvem som helst. Eli Lifland har de mest treffsikre spådommene blant alle deltakerne i RANDS «Forecasting Initiative». Daniel Kokotajlo jobbet tidligere i KI-selskapet OpenAI. Hans spådommer om KI-utviklingen fra 2021 har vist seg å være skremmende presise. Les hans bloggpost «What 2026 looks like» fra 2021, så kan du bedømme selv.

2021 var året før ChatGPT revolusjonerte vår forståelse av språkmodeller og KI-systemers evne til å kommunisere som mennesker. Ting har ikke stått stille siden ChatGPT ble lansert på tampen av 2022, og ble historiens raskest voksende applikasjon i januar 2023 med 100 millioner aktive brukere.

Nå kan KI-modellene lage helt realistiske videoklipp, generere bilder som om de var profesjonelle fotografer eller kunstnere, skrive masteroppgaver som står til A og gjøre det bedre på tester enn folk med doktorgrad i fagene.

Nye og bedre modeller lanseres fortere enn vi rekker å bli kjent med de eksisterende. De fleste av oss klarer ikke holde tritt. Forfatterne av AI 2027 forsøker derimot å se inn i fremtiden, hvor superintelligente KI-systemer tar over kontrollen.

Det er vanskelig å tro at KI-systemer skal bli så intelligente som forfatterne tror. Tross at chatbotene allerede er smartere enn de aller fleste mennesker, har de i liten grad endret arbeidslivet eller hvordan vi styrer samfunnet.

Det har likevel sin naturlige forklaring. Deres avgjørelser er ofte vanskelig å forstå. I jobber hvor det er viktig å begrunne avgjørelsene, legger manglende gjennomsiktighet bremser på bruken. Det er også usikkerhet om hvordan dataene vi gir til KI-modellene håndteres. Vi kan ikke integrere KI-systemer i viktige samfunnsfunksjoner uten å være sikker på at sensitive data ikke kommer på avveie.

Den viktigste grunnen til at KI-systemene ikke har endret samfunnet, er imidlertid at modellene er passive og avhengige av kontinuerlig styring. For at arbeidere skal erstattes med maskiner i stor skala, må maskinene kunne operere på egen hånd. Det kan ikke dagens modeller.

Dette er imidlertid i ferd med å endre seg. Siste skrik fra KI-selskapene er simple «KI-aktører», det vil si KI-systemer som kan utforme oppgaver på egen hånd. De beste modellene kan utføre oppgaver som strekker seg over en time. Og lengden på oppgavene systemene kan utføre, dobler seg hver sjuende måned. Fortsetter utviklingen, vil KI-aktørene, innen få år, utføre kompliserte oppgaver over flere uker og etter hvert måneder.

Legg dette sammen med et annet utviklingstrekk, nemlig at modellene blir stadig bedre som følge av mer trening og ved at systemene får tenke før de svarer. Den som tillater seg å se langs linjene og inn i fremtiden, vil forstå at verden vil kunne se ganske annerledes ut om noen få år.

Mye spenning er knyttet til om KI-systemene vil bli like smarte som mennesker på et bredt spekter av oppgaver, altså bli generelt intelligente. Men det er ingen grunn til å forvente at et system som blir intelligent på menneskenivå vil stoppe der.

En viktig del av fortellingen i AI 2027, er at et KI-system som når et visst intelligensnivå kan brukes til å forbedre seg selv og dermed bli mer intelligent enn mennesker; de kan bli superintelligente.

KI-systemer som forbedrer seg selv er ikke science fiction. Ta for eksempel spillet Go, et svært komplisert spill som det tar årtier for mennesker å mestre. Ved hjelp av «forsterkende læring» kunne DeepMinds AlphaZero trene seg selv til å bli verdens beste Go-spiller i løpet av noen dager.

Hvis de beste KI-systemene begynner å forbedre seg selv, vil vi befinne oss i en vanskelig situasjon. Det første spørsmålet er hvordan vi kan kontrollere et system som er smartere enn oss selv. Vi kan ikke vite om systemene faktisk har internalisert våre verdier, eller om de bare later som. Allerede dagens modeller viser tegn til å lure oss.

Hvis systemene lurer oss og blir superintelligente, vil det bare være snakk om tid før de utmanøvrerer oss. Dette er veien til menneskehetens utslettelse, skal vi tro forfatterne av AI 2027.

Det er derfor essensielt at selskapene lykkes i å kontrollere KI-systemene de lager. Men, som forfatterne beskriver, er det ikke åpenbart hvem som i så fall skal kontrollere systemene.

I dag er det amerikanerne og kineserne som leder an i kappløpet. Ingen ønsker at Kina skal komme først i mål. Men hvor trygge er vi hvis det heller er Trumps Amerika som først får kontrollen over det som vil bli menneskehetens mektigste våpen?

I dag finnes det ingen lykkelig løsning på superintelligente systemer. Det sikreste vi kan gjøre er å forsøke å ta fra selskapene makten til å lage slike systemer uten kontroll fra verdenssamfunnet. Men i disse dager, hvem setter pengene sine på at verdenssamfunnet greier å summe seg?

Last ned