Jeg trodde menneskeheten er trygg for bare 2 dager siden, det teller bokstavelig talt i dager ... Litt kontekst: Dette er ikke første gang AI har tatt medalje i den internasjonale matematikkolympiaden (IMO). I fjor vant Googles AlphaProof sølv – men den modellen ble trent spesielt for matematikk. Denne gangen brukte OpenAI en generell modell (sannsynligvis en intern GPT-5-prototype?), og den vant gull. Det er et stort sprang i betydning. For å sette dette i perspektiv: å løse et problem på IMO-nivå tar vanligvis menneskelige elitekonkurrenter omtrent 100 minutter. For bare 2 år siden slet de beste AI-modellene fortsatt med ordproblemer på grunnskolen (GSM8k), som tar mennesker omtrent 10 sekunder å løse. Som OpenAIs Dan Roberts delte på Sequoias AI Ascent 2025, dobles lengden på oppgaver AI kan håndtere hver 7. Innen slutten av 2025 kan GPT-5 meget vel operere på timelange menneskelige oppgavenivåer. En advarsel: Årets IMO hadde angivelig en feil i vanskelighetsbalansen – oppgave 1–5 var relativt lett, mens oppgave 6 var uvanlig vanskelig. Som et resultat grupperte mange poeng seg mellom 28–35 (hver oppgave er verdt 7 poeng). AI-en fikk 35 – akkurat nok til gull. Litt flaks, men banen er ubestridelig. Sist ikke minst vil mattekonkurransene utvilsomt være et kappløp mellom kinesere i Kina, kinesere i USA og AI-modeller (bygget av kinesere i USA og Kina)
Alexander Wei
Alexander Wei19. juli, 15:50
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).
5,42K