DApp Store | Web3 Hub for hendelser og spill

Populære emner

Vi kan være på vei inn i en plottvri i OpenAI vs. DeepMind IMO-sagaen. Så nettopp et innlegg fra Joseph Myers (involvert i matematikkolympiaden siden 1992): IMO-komiteen skal ha bedt AI-laboratorier om ikke å publisere resultater før 7 dager etter avslutningsseremonien – av respekt for menneskelige deltakere (se innlegget mitt i går) og sannsynligvis for å gi tid til riktig verifisering av AI-innsendinger og formater. Ifølge Joseph samarbeidet ikke OpenAI med IMO for å teste modellen deres, og ingen av de 91 offisielle IMO-koordinatorene var involvert i å gradere løsningene. I mellomtiden ser det ut til at DeepMind følger reglene og tålmodig venter på sin tur. For kontekst: IMO har 6 problemer, hver verdt 7 poeng. Årets gullgrense er 35 poeng. Selv et lite fradrag kan slå OpenAI ned til sølv. Og fra min lesning av deres skriverier, kan noen deler reise spørsmål - og muligens koste poeng. Terence Tao påpekte også at selv om problemene forblir de samme, er testformater viktige. En student som ikke ville fått en bronse under standardforhold, kan finne gull med et modifisert oppsett – noe som reiser reelle spørsmål om hva «å løse IMO» betyr for AI. Neste uke kan bli krydret. Følg med.

@swierk De fant 3 tidligere IMO-medaljevinnere som ikke var offisielle IMO-koordinatorer: «For hvert problem graderte tre tidligere IMO-medaljevinnere uavhengig av hverandre modellens innsendte bevis, med poengsummene ferdigstilt etter enstemmig konsensus.»

Mitt forrige innlegg om IMO-komiteens forespørsel

@GoogleDeepMind overmenneskelige resonneringsteamleder @lmthang reiste også spørsmålet om OpenAI ville vinne et gull eller sølv

@GoogleDeepMind overmenneskelige resonnementteamleder @lmthang som bygde AlphaGeometry reiste også spørsmålet om OpenAI ville vinne en gull- eller sølvmedalje

@swierk ja, det er flere og flere spørsmål reist av matematikk- og AI-folk

87,08K

Topp

Rangering

Favoritter

Trendende onchain

Trendende på X

Nylig toppfinansiering

Mest lagt merke til