Nyhetsbrev Langsikt

KI-horisonten: mars

OpenAI setter fyr på internett, Google lanserer verdens kraftigste KI-modell hittil og ny forskning viser at KI-modellers evne til å løse oppgaver dobler seg hver syvende måned. Her er noen av de viktigste KI-nyhetene som skjedde i mars.

Anders Eidesvik

OpenAI setter fyr på internett (igjen)

  • OpenAI har lansert ny bilde-genereringstjeneste for Sora som gjør at hvem som helst (nesten) kan skape hva som helst.
  • Det blir vanskeligere å skille ekte og falske bilder. Nå hjelper det ikke lenger å telle fingre eller tenner for å se om noe er KI-generert.
  • Sora klarer også å gjenskape leselig tekst i stedet for meningsløs bokstavsuppe.
  • OpenAI utfordrer opphavsretten. Det blir spennende å se hvem som vinner.

OpenAI har lansert ny bilde-genereringstjeneste for Sora som gjør at hvem som helst (nesten) kan skape hva som helst. Ved hjelp av et enkelt tastetrykk kan brukere av ChatGPT omgjøre kongefamilien til Muppets, gjenskape en fuktig kveld mellom statsmenn på bar eller skape ultrarealistiske pressefoto av et møte mellom Putin og Støre som aldri fant sted.

Bak bildene ligger det en ny teknikk for bildegenerering, og kvaliteten og treffsikkerheten på modellene har økt betraktelig. Den klarer for eksempel å genere meningsfull tekst i stedet for meningsløse ordsupper, noe som har vært en stor utfordring for KI. I tillegg har tester som å telle antall fingre eller tenner blitt ubrukelige. Nå trenger man nye markører for å se om noe er KI-generert eller ikke.

Så hva blir konsekvensene av alt dette? Jeg tror vi kan forvente at nettet blir fylt opp av enda mer KI-generert innhold, enten det er gøye familiebilder, falske nyhetsbilder eller regelrett slop. Når det gjelder kommersiell verdi, så vil denne og kommende KI-modeller ha en stor effekt på reklame- og markedsføringsbyrå. Det er med andre ord en dårlig uke for fotografer, modeller og grafiske designere.

Mikke Gahr Støre

Mikke Gahr Støre

Gir OpenAI blaffen i opphavsrett? I teorien skal Sora nekte brukere å kopiere stilen til levende kunstnere, men det kan omgås svært lett (det var f.eks ingen feilmeldinger eller problemer da jeg ba den lage et bilde av Støre som Mikke Mus). Når KI-selskapene tør å lansere dette, så er det trolig fordi de føler seg trygge på at de vil komme unna med det. Trump-administrasjonen har tydelig slått fast at de ikke vil lage reguleringer som hindrer KI-utviklingen. Jussen kan fremdeles bli en eksistensiell trussel mot KI-selskapene som alle trener på datasett flust i opphavsrettslig materiale, men i denne omgang ser det ut som kampen er over.

Ny forskning: KI-modellers evne til å utføre oppgaver dobler seg hver syvende måned

  • Ny forskning viser at KI-modellers evne til å løse lange oppgaver dobler seg hver syvende måned.
  • Om trenden fortsetter, vil man få KI-modeller som kan utføre et helt dagsarbeid innen 2026-27, og månedslange prosjekter innen utgangen av 2030.
  • METRs forskning bidrar til å forklare paradokset om hvorfor KI-modeller kan slå mennesker på kompliserte eksperttester men sliter med enkle oppgaver.

Forskningsenteret METR har undersøkt hvor lange oppgaver forskjellige KI-modeller klarer å løse uten å gjøre feil. Lengden på oppgaven er målt opp mot hvor lang tid en menneskelig ekspert ville brukt på samme oppgave, som for eksempel tiden det tar å svare på et spørsmål eller telle ord i et avsnitt.

METR ser hele veien tilbake til GPT 2 i 2019, som bare klarte å løse oppgaver som tok mindre enn tre sekunder. Siden den gang har modellene bare blitt kraftigere, og Anthropics siste modell klarer nå å løse oppgaver som tar en time. Legg merke til at grafen ovenfor er logaritmisk (dvs. går fra 1 sek, til 4 sek, til 15 sek osv.) Om man ser på den lineære versjonen, ser man tydeligere at veksten er eksponentiell.

METRs forskning forklarer et viktig paradoks: Dagens KI-modeller kan slå mennesker på kompliserte kunnskapstester, men sliter med å hjelpe til i vanlig arbeid. Årsaken er at de fleste praktiske oppgaver krever flere sammenhengende steg som bygger på hverandre. Selv om KI er fantastisk på enkeltoppgaver, mister den ofte tråden i lengre sekvenser.

Fram til nå har lengden på oppgaver modellene klarer å løse, doblet seg omtrent hver syvende måned. Hvordan vil det utvikle seg framover? Om trenden fortsetter, vil man få KI-modeller som kan utføre et helt dagsarbeid innen 2026, og månedslange prosjekter innen utgangen av 2030.

Det vil i så fall kunne ha store konsekvenser for samfunnet vårt når det gjelder forskning og økonomi. Samtidig kan hende at trenden blir enda brattere eller flater ut. METRs forskning forholder seg bare til historiske data. Vi vet ikke hvordan framtiden vil bli.

Det må understrekes at forskningen har en rekke begrensninger og antakelser som man kan være uenig med. For eksempel skiller oppgavene de måler seg en del fra oppgaver man vil møte i den virkelige verden. Om du vil lese mer, anbefaler jeg å sjekke ut Shakeel Hashims analyse på Transformer eller å lese METRs egen artikkel.

KI-diskusjonen blir mainstream

Skjermdump: New York Times

Skjermdump: New York Times

Lenge har ideen om at vi en dag kan få kunstig generell intelligens (KGI), dvs KI som er like smart eller smartere enn mennesker på alle områder, vært sett på som science fiction av de fleste. Dette er i ferd med å endre seg og det blir stadig flere forskere, næringslivstopper og andre som mener at det er mulig å skape KGI.

Senest ute var topprådgiver for KI i Det hvite hus, Ben Buchanan, som deltok på podcasten til Ezra Klein i New York Times. Både Buchanan og Klein mener at vi kan få KGI allerede i løpet av Trumps periode som president. Også mangeårige teknologijournalist Kevin Roose i NYT deler samme oppfatning. Han skriver:

I believe that most people and institutions are totally unprepared for the A.I. systems that exist today, let alone more powerful ones, and that there is no realistic plan at any level of government to mitigate the risks or capture the benefits of these systems.
I believe that hardened A.I. skeptics — who insist that the progress is all smoke and mirrors, and who dismiss A.G.I. as a delusional fantasy — not only are wrong on the merits, but are giving people a false sense of security.
I believe that the right time to start preparing for A.G.I. is now.

Det er ganske oppsiktsvekkende at både Klein og Roose skriver om KGI i verdens største avis. Når KGI blir ansett som en ekte mulighet av politikere og journalister globalt kan vi vente store endringer i KI-debatten. I Norge er det fremdeles lite snakk om KGI, selv om Teknologirådet nevner det som en mulighet i sin Teknotrendsrapport til Stortinget 2025.

Google lanserer den kraftigste KI-modellen hittil

En nyhet som har druknet fullstendig i alt annet er at Google har lansert det som flere kaller verdens kraftigste KI-modell hittil. Gemini 2.5 Pro utmerker seg ved blant annet å kunne behandle opptil én million tokens (og snart to millioner) i én sammenhengende prompt. Dette er nok til å mate inn hele Ringenes Herre-trilogien i modellen før man starter samtalen. I tillegg gjør den det best i klassen på krevende resonnerings- og kodeoppgaver og topper flere tester som «Humanity’s Last Exam» og «Google-Proof Q&A».

Samtidig kritiseres Google for manglende åpenhet rundt sikkerhetstesting av modellen. I Transformer Weekly påpekes det at Google har lovet å publisere et «system card» for alle nye, kraftige KI-modeller, men at de ikke har gjort dette for Gemini 2.5 Pro – i motsetning til praksisen hos både OpenAI og Anthropic.

Google har tidligere forpliktet seg til større åpenhet, blant annet i White House-initiativet i juli 2023 og Seoul-erklæringen, men ingen dokumentasjon foreligger foreløpig. Dermed er det uklart om eller hvor grundig modellen faktisk er testet for mulige misbruk- og sikkerhetsrisikoer.

Del artikkelen: