DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Het was magisch om het model deze IMO-problemen te zien oplossen en een gouden niveau van prestaties te bereiken. Een paar gedachten 🧵

Het model lost deze problemen op zonder tools zoals lean of coderen, het gebruikt gewoon natuurlijke taal, en heeft ook maar 4,5 uur. We zien het model op een zeer hoog niveau redeneren - verschillende strategieën uitproberen, observaties maken uit voorbeelden en hypothesen testen.

Het is gek hoe we in ~ 15 maanden van 12% op AIME (GPT 4o) → IMO goud zijn gegaan. We zijn heel ver gekomen, heel snel. Het zou me niet verbazen als modellen volgend jaar nieuwe stellingen afleiden en bijdragen aan origineel wiskundig onderzoek!

487,12K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste