Щойно вийшов з роботи і спробував Grok-4 на задачі з топології бакалаврату. Йому знадобилося 9 хвилин на роздуми, а потім впевнено дали чисту, правдоподібну, але абсолютно неправильну відповідь 😅 Не думайте, що це можна кваліфікувати як «вміло змагальний». Моделі штучного інтелекту є нищівними орієнтирами, але для реального математичного AGI ще далеко попереду.
Elon Musk
Elon Musk10 лип., 16:47
Grok 4 знаходиться на тому етапі, коли він, по суті, ніколи не помиляється в питаннях іспиту з математики/фізики, якщо тільки вони не є вміло змагальними. Він може виявляти помилки або двозначності в питаннях, потім виправляти помилку в питанні або відповідати на кожен варіант неоднозначного питання.
663K