Ani bronz: Hodnocení LLM na Mezinárodní matematické olympiádě 🥉 2025 Pěkný příspěvek na blogu od týmu stojícího za MathArena: Hodnocení LLM na nekontaminovaných matematických soutěžích () poskytující nezávislou analýzu výkonu LLM na IMO.
Vypadá to, že pokročilá verze Gemini s Deep Think právě vyřešila 5 ze 6 problémů IMO, získala celkem 35 bodů a oficiálně dosáhla výkonu na úrovni zlaté medaile. Gratulujeme k úspěchu @lmthang❗️ Nemůžu se dočkat, až si s tímto modelem zahraji
42,43K