Нам потрібно кілька місяців, щоб перетворити рубіж експериментальних досліджень на продукт. Але прогрес настільки швидкий, що кілька місяців можуть означати велику різницю в можливостях.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 лип., 09:17
Отже, всі моделі поступаються людям у питаннях нової Міжнародної математичної олімпіади, і Grok-4 особливо погано справляється з цим, навіть при виборі best of-n? Неймовірно!
123,3K