Takže všechny modely v nových otázkách Mezinárodní matematické olympiády zaostávají za lidmi a Grok-4 je v tom obzvláště špatný, a to i při výběru best-of-n? Neuvěřitelný!
531,98K