Więc wszystkie modele wypadają gorzej niż ludzie w nowych pytaniach z Międzynarodowej Olimpiady Matematycznej, a Grok-4 jest w tym szczególnie zły, nawet przy najlepszym wyborze z n? Niewiarygodne!
531,99K