Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Spoluzakladatel a generální ředitel @Hyperbolic_Labs. ex-@avax & ex-@citsecurities. Doktorát z matematiky jsem dokončil za 2 roky @UCBerkeley. Zlatá medailistka z matematické olympiády. Nejvyšší vyznamenání @PKU1898
Možná míříme do dějového zvratu v sáze OpenAI vs. DeepMind IMO.
Právě jsem viděl příspěvek od Josepha Myerse (zapojeného do matematické olympiády od roku 1992): výbor IMO údajně požádal laboratoře AI, aby nezveřejňovaly výsledky dříve než 7 dní po závěrečném ceremoniálu – z úcty k lidským soutěžícím (viz můj včerejší příspěvek) a pravděpodobně aby poskytly čas na řádné ověření odeslaných příspěvků a formátů AI.
Podle Josepha OpenAI nespolupracovala s IMO na testování jejich modelu a žádný z 91 oficiálních koordinátorů IMO se nepodílel na hodnocení jejích řešení. Mezitím se zdá, že DeepMind dodržuje pravidla a trpělivě čeká, až na ně přijde řada.
Pro kontext:
IMO má 6 úloh, z nichž každý má hodnotu 7 bodů. Letošní zlatá hranice je 35 bodů. I malá srážka by mohla OpenAI srazit na stříbro. A z toho, co jsem četl jejich zápisy, by některé části mohly vyvolat otázky – a možná i náklady.
Terence Tao také poukázal na to, že i když problémy zůstávají stejné, na testovacích formátech záleží. Student, který by za standardních podmínek nezískal bronzovou medaili, by mohl s upraveným nastavením dosáhnout zlata – což vyvolává skutečné otázky o tom, co pro umělou inteligenci znamená "vyřešení IMO".
Příští týden by mohl být pikantní. Zůstaňte naladěni.


87,08K
Společnost DeepMind získala v pátek odpoledne zlatou medaili na IMO. Museli však počkat, až marketingový tým tweet schválí – až do pondělí.
@OpenAI se o ty své podělili poprvé v sobotu v 1 hodinu ráno a ukradli pozornost veřejnosti.
V této hře > rychlost byrokracie. Promeškejte okamžik, ztraťte příběh.
214,98K
Právě jsem odešel z práce a vyzkoušel Grok-4 na vysokoškolském problému topologie. Trvalo mu 9 minut přemýšlet a pak jsem s jistotou dal čistou, věrohodnou, ale zcela špatnou odpověď 😅
Nemyslete si, že se tento případ kvalifikuje jako "dovedně nepřátelský". Modely umělé inteligence drtí benchmarky – ale pro skutečnou matematickou AGI jsou stále daleko vpředu.



Elon Musk10. 7. 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
662,99K
Grok získal plný počet bodů na AIME 🤯 Rozhodně nyní potřebujeme lepší matematický benchmark pro AI


xAI10. 7. 12:01
Představujeme Grok 4, nejvýkonnější model umělé inteligence na světě. Podívejte se na živý přenos:
2,98K
Budoucnost umělé inteligence je ve spolupráci

Yuchen Jin9. 7. 06:09
Sam Altman was asked how he felt about Zuck and Meta poaching OpenAI’s top talent.
“Fine... good...” he said.
Behind Jony Ive–designed glasses, I couldn’t see his eyes. But I could feel the pain.
It's not hard for Zuck to poach OpenAI talent, not just because he has the money, but because open-source AI is fulfilling the original OpenAI mission.
1,44K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější