Właśnie skończyłem pracę i spróbowałem Grok-4 na problemie z topologii dla studentów. Zajęło mi to 9 minut myślenia, a potem pewnie podał czystą, wiarygodną, ale całkowicie błędną odpowiedź 😅 Nie sądzę, żeby to się kwalifikowało jako "umiejętnie wrogie." Modele AI rozbijają benchmarki — ale wciąż daleko do prawdziwej matematycznej AGI.
Elon Musk
Elon Musk10 lip, 16:47
Grok 4 jest na etapie, w którym zasadniczo nigdy nie popełnia błędów w pytaniach z matematyki/fizyki, chyba że są one umiejętnie złośliwe. Potrafi zidentyfikować błędy lub niejasności w pytaniach, a następnie naprawić błąd w pytaniu lub odpowiedzieć na każdą wersję niejasnego pytania.
663K