Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
S-ar putea să ne îndreptăm spre o răsturnare de situație în saga OpenAI vs. DeepMind IMO.
Tocmai am văzut o postare de la Joseph Myers (implicat în Olimpiada de Matematică din 1992): comitetul IMO a cerut laboratoarelor AI să nu publice rezultatele decât la 7 zile după ceremonia de închidere – din respect pentru concurenții umani (vezi postarea mea de ieri) și probabil pentru a permite timp pentru verificarea corespunzătoare a trimiterilor și formatelor AI.
Potrivit lui Joseph, OpenAI nu a colaborat cu OMI pentru a-și testa modelul și niciunul dintre cei 91 de coordonatori oficiali ai OMI nu a fost implicat în evaluarea soluțiilor sale. Între timp, se pare că DeepMind respectă regulile și își așteaptă cu răbdare rândul.
Pentru context:
IMO are 6 probleme, fiecare valorând 7 puncte. Limita de aur din acest an este de 35 de puncte. Chiar și o mică deducere ar putea doborî OpenAI la argint. Și din citirea mea a articolelor lor, unele părți ar putea ridica întrebări – și posibil puncte de cost.
Terence Tao a subliniat, de asemenea, că, deși problemele rămân aceleași, formatele de testare contează. Un student care nu ar obține un bronz în condiții standard ar putea obține aur cu o configurație modificată – ceea ce ridică întrebări reale despre ce înseamnă "rezolvarea IMO" pentru AI.
Săptămâna viitoare ar putea deveni picantă. Rămâneți pe fază.



20 iul., 03:15
DeepMind a obținut o medalie de aur la IMO vineri după-amiază. Dar au trebuit să aștepte ca marketingul să aprobe tweet-ul – până luni.
@OpenAI împărtășit prima dată la ora 1 dimineața sâmbătă și a furat lumina reflectoarelor.
În acest joc, viteza > birocrație. Ratează momentul, pierde narațiunea.
@swierk Au găsit 3 foști medaliați IMO care nu sunt coordonatori oficiali ai OMI: "Pentru fiecare problemă, trei foști medaliați IMO au notat în mod independent dovada trimisă de model, cu scoruri finalizate după un consens unanim."

19 iul., 15:50
6/N În evaluarea noastră, modelul a rezolvat 5 din cele 6 probleme din IMO 2025. Pentru fiecare problemă, trei foști medaliați IMO au notat în mod independent dovada trimisă de model, scorurile fiind finalizate după un consens unanim. Modelul a câștigat 35/42 de puncte în total, suficient pentru aur! 🥇
Postarea mea anterioară despre cererea comisiei OMI

20 iul., 05:42
Clarificare: Cineva de la Google mi-a spus că rezultatele lor IMO sunt încă verificate intern. Odată ce acest lucru este făcut, plănuiesc să le împărtășească oficial - curioși să vadă abordarea lor.
O altă sursă a menționat că comitetul OMI a cerut să nu discute public despre implicarea AI în termen de o săptămână după ceremonia de închidere. Lucrurile au devenit puțin mai interesante 🧐
@GoogleDeepMind șef al echipei de raționament supraomenesc @lmthang ridicat și întrebarea dacă OpenAI va câștiga aurul sau argintul

20 iul., 05:42
Clarificare: Cineva de la Google mi-a spus că rezultatele lor IMO sunt încă verificate intern. Odată ce acest lucru este făcut, plănuiesc să le împărtășească oficial - curioși să vadă abordarea lor.
O altă sursă a menționat că comitetul OMI a cerut să nu discute public despre implicarea AI în termen de o săptămână după ceremonia de închidere. Lucrurile au devenit puțin mai interesante 🧐
@GoogleDeepMind lider al echipei de raționament supraomenesc @lmthang care a construit AlphaGeometry a ridicat, de asemenea, întrebarea dacă OpenAI va câștiga o medalie de aur sau de argint

20 iul., 23:47
Da, există un ghid oficial de marcare de la organizatorii OMI care nu este disponibil extern. Fără evaluarea bazată pe acest ghid, nu se poate face nicio revendicare a medaliei. Cu un punct dedus, este argint, nu aur.
@swierk da, există din ce în ce mai multe întrebări ridicate de oamenii de matematică și AI

21 iul., 03:41
@GoogleDeepMind lider al echipei de raționament supraomenesc @lmthang care a construit AlphaGeometry a ridicat, de asemenea, întrebarea dacă OpenAI va câștiga o medalie de aur sau de argint
232,23K
Limită superioară
Clasament
Favorite