Nawet nie brąz: Ocena LLM-ów na Międzynarodowej Olimpiadzie Matematycznej 2025 🥉 Fajny post na blogu zespołu stojącego za MathArena: Ocena LLM-ów na niekontaminowanych zawodach matematycznych () dostarczająca niezależnej analizy wydajności LLM na IMO.
Wygląda na to, że zaawansowana wersja Gemini z Deep Think właśnie rozwiązała 5 z 6 problemów IMO, zdobywając łącznie 35 punktów i oficjalnie osiągając poziom złotego medalu. Gratulacje z osiągnięcia @lmthang❗️ Nie mogę się doczekać, aby pobawić się tym modelem.
42,48K