DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

S-ar putea să ne îndreptăm spre o răsturnare de situație în saga OpenAI vs. DeepMind IMO. Tocmai am văzut o postare de la Joseph Myers (implicat în Olimpiada de Matematică din 1992): comitetul IMO a cerut laboratoarelor AI să nu publice rezultatele decât la 7 zile după ceremonia de închidere – din respect pentru concurenții umani (vezi postarea mea de ieri) și probabil pentru a permite timp pentru verificarea corespunzătoare a trimiterilor și formatelor AI. Potrivit lui Joseph, OpenAI nu a colaborat cu OMI pentru a-și testa modelul și niciunul dintre cei 91 de coordonatori oficiali ai OMI nu a fost implicat în evaluarea soluțiilor sale. Între timp, se pare că DeepMind respectă regulile și își așteaptă cu răbdare rândul. Pentru context: IMO are 6 probleme, fiecare valorând 7 puncte. Limita de aur din acest an este de 35 de puncte. Chiar și o mică deducere ar putea doborî OpenAI la argint. Și din citirea mea a articolelor lor, unele părți ar putea ridica întrebări – și posibil puncte de cost. Terence Tao a subliniat, de asemenea, că, deși problemele rămân aceleași, formatele de testare contează. Un student care nu ar obține un bronz în condiții standard ar putea obține aur cu o configurație modificată – ceea ce ridică întrebări reale despre ce înseamnă "rezolvarea IMO" pentru AI. Săptămâna viitoare ar putea deveni picantă. Rămâneți pe fază.

@swierk Au găsit 3 foști medaliați IMO care nu sunt coordonatori oficiali ai OMI: "Pentru fiecare problemă, trei foști medaliați IMO au notat în mod independent dovada trimisă de model, cu scoruri finalizate după un consens unanim."

Postarea mea anterioară despre cererea comisiei OMI

@GoogleDeepMind șef al echipei de raționament supraomenesc @lmthang ridicat și întrebarea dacă OpenAI va câștiga aurul sau argintul

@GoogleDeepMind lider al echipei de raționament supraomenesc @lmthang care a construit AlphaGeometry a ridicat, de asemenea, întrebarea dacă OpenAI va câștiga o medalie de aur sau de argint

@swierk da, există din ce în ce mai multe întrebări ridicate de oamenii de matematică și AI

232,23K

Limită superioară

Clasament

Favorite

La modă pe lanț

La modă pe X

Principalele finanțări recente

Cele mai importante