Cel mai greu examen de matematică de liceu din lume, problema 6 9 ore IMO 2025, a fost săptămâna aceasta. Modelele AI au avut performanțe slabe. Gemini 2.5 Pro a obținut cel mai mare punct, doar 13/42, costând 431,97 USD, într-un cel mai bun din 32 de valori. Limita de bronz a fost de 19. Un drum lung de parcurs pentru ca AI să rezolve matematica dificilă.
Iată o vizualizare mai frumoasă a performanței modelului pe MathArena
P6 a fost cu siguranță cea mai grea și mai interesantă problemă. Majoritatea oamenilor o pot înțelege, dar foarte puțini o pot rezolva. Toate modelele au obținut un scor de 0/7.
Mică corecție:
Alexander Wei
Alexander Wei19 iul., 15:50
1/N Sunt încântat să vă împărtășesc că cel mai recent @OpenAI raționament experimental LLM a realizat o mare provocare de lungă durată în AI: performanța la nivel de medalie de aur la cea mai prestigioasă competiție de matematică din lume - Olimpiada Internațională de Matematică (IMO).
200,65K