S-ar putea să ne îndreptăm spre o răsturnare de situație în saga OpenAI vs. DeepMind IMO. Tocmai am văzut o postare de la Joseph Myers (implicat în Olimpiada de Matematică din 1992): comitetul IMO a cerut laboratoarelor AI să nu publice rezultatele decât la 7 zile după ceremonia de închidere – din respect pentru concurenții umani (vezi postarea mea de ieri) și probabil pentru a permite timp pentru verificarea corespunzătoare a trimiterilor și formatelor AI. Potrivit lui Joseph, OpenAI nu a colaborat cu OMI pentru a-și testa modelul și niciunul dintre cei 91 de coordonatori oficiali ai OMI nu a fost implicat în evaluarea soluțiilor sale. Între timp, se pare că DeepMind respectă regulile și își așteaptă cu răbdare rândul. Pentru context: IMO are 6 probleme, fiecare valorând 7 puncte. Limita de aur din acest an este de 35 de puncte. Chiar și o mică deducere ar putea doborî OpenAI la argint. Și din citirea mea a articolelor lor, unele părți ar putea ridica întrebări – și posibil puncte de cost. Terence Tao a subliniat, de asemenea, că, deși problemele rămân aceleași, formatele de testare contează. Un student care nu ar obține un bronz în condiții standard ar putea obține aur cu o configurație modificată – ceea ce ridică întrebări reale despre ce înseamnă "rezolvarea IMO" pentru AI. Săptămâna viitoare ar putea deveni picantă. Rămâneți pe fază.
Jasper
Jasper20 iul., 03:15
DeepMind a obținut o medalie de aur la IMO vineri după-amiază. Dar au trebuit să aștepte ca marketingul să aprobe tweet-ul – până luni. @OpenAI împărtășit prima dată la ora 1 dimineața sâmbătă și a furat lumina reflectoarelor. În acest joc, viteza > birocrație. Ratează momentul, pierde narațiunea.
@swierk Au găsit 3 foști medaliați IMO care nu sunt coordonatori oficiali ai OMI: "Pentru fiecare problemă, trei foști medaliați IMO au notat în mod independent dovada trimisă de model, cu scoruri finalizate după un consens unanim."
Alexander Wei
Alexander Wei19 iul., 15:50
6/N În evaluarea noastră, modelul a rezolvat 5 din cele 6 probleme din IMO 2025. Pentru fiecare problemă, trei foști medaliați IMO au notat în mod independent dovada trimisă de model, scorurile fiind finalizate după un consens unanim. Modelul a câștigat 35/42 de puncte în total, suficient pentru aur! 🥇
Postarea mea anterioară despre cererea comisiei OMI
Jasper
Jasper20 iul., 05:42
Clarificare: Cineva de la Google mi-a spus că rezultatele lor IMO sunt încă verificate intern. Odată ce acest lucru este făcut, plănuiesc să le împărtășească oficial - curioși să vadă abordarea lor. O altă sursă a menționat că comitetul OMI a cerut să nu discute public despre implicarea AI în termen de o săptămână după ceremonia de închidere. Lucrurile au devenit puțin mai interesante 🧐
@GoogleDeepMind șef al echipei de raționament supraomenesc @lmthang ridicat și întrebarea dacă OpenAI va câștiga aurul sau argintul
Jasper
Jasper20 iul., 05:42
Clarificare: Cineva de la Google mi-a spus că rezultatele lor IMO sunt încă verificate intern. Odată ce acest lucru este făcut, plănuiesc să le împărtășească oficial - curioși să vadă abordarea lor. O altă sursă a menționat că comitetul OMI a cerut să nu discute public despre implicarea AI în termen de o săptămână după ceremonia de închidere. Lucrurile au devenit puțin mai interesante 🧐
@GoogleDeepMind lider al echipei de raționament supraomenesc @lmthang care a construit AlphaGeometry a ridicat, de asemenea, întrebarea dacă OpenAI va câștiga o medalie de aur sau de argint
Thang Luong
Thang Luong20 iul., 23:47
Da, există un ghid oficial de marcare de la organizatorii OMI care nu este disponibil extern. Fără evaluarea bazată pe acest ghid, nu se poate face nicio revendicare a medaliei. Cu un punct dedus, este argint, nu aur.
@swierk da, există din ce în ce mai multe întrebări ridicate de oamenii de matematică și AI
Jasper
Jasper21 iul., 03:41
@GoogleDeepMind lider al echipei de raționament supraomenesc @lmthang care a construit AlphaGeometry a ridicat, de asemenea, întrebarea dacă OpenAI va câștiga o medalie de aur sau de argint
232,23K