Niet eens brons: Evaluatie van LLM's op de Internationale Wiskunde Olympiade 2025 🥉 Leuk blogbericht van het team achter MathArena: Evaluatie van LLM's op onbesmette wiskundewedstrijden () die een onafhankelijke analyse van de prestaties van LLM's op de IMO biedt.
Het lijkt op een geavanceerde versie van Gemini met Deep Think die 5 van de 6 IMO-problemen heeft opgelost, goed voor in totaal 35 punten, en officieel een gouden medaille-niveau prestatie heeft behaald. Gefeliciteerd met de prestatie @lmthang❗️ Kan niet wachten om met dit model te spelen.
42,53K