Статичні бенчмарки надзвичайно важливі, і продуктивність @grok 4, безсумнівно, вражає. Я все ще чекаю, щоб побачити, що люди думають про модель, коли вона опиняється у них в руках. Чи виправдає він очікування? Зрештою, мова йде про реальну корисність для окремих користувачів. Grok 4 знаходиться в руках мільйонів наших користувачів на @lmarena_ai. Не можу дочекатися, щоб побачити, що вони думають як перший крок! Зі свого боку, я намагався поставити кілька складних математичних запитань, і, здається, у @grok виходить чудово. Вона лаконічна і фактична. Здається, дуже розумно, і мені подобається обговорювати дослідження з цією моделлю. Ознайомтеся з доказами, пов'язаними з обміном, на прикріпленому зображенні! Начебто ніяких жучків...
8,6K