Was für ein wildes Wochenende über KI und IMO. Wenn ich auf die letzten 3 Tage zurückblicke, habe ich Folgendes erlebt: > Freitagnachmittag: geleakte Informationen darüber, dass DeepMind Gold gewonnen hat > Samstag um 1 Uhr: OpenAI hat die offizielle Ankündigung vorweggenommen und die Aufmerksamkeit gestohlen > Zunächst dachte ich, Google sei einfach nur langsam wegen der Marketinggenehmigung > Dann hörte ich von Google-Mitarbeitern, dass IMO und sie selbst zusätzliche Zeit für die Überprüfung benötigten > Es stellte sich heraus, dass OpenAI IMO nicht einmal offiziell einbezogen hat > Montag: DeepMind bestätigte ihr Gold mit klareren und ästhetischeren Antworten, die vollständig von der IMO verifiziert wurden Es war lustig, am letzten Freitag die ersten Neuigkeiten auf X zu teilen. Was für ein wildes Wochenende! Scherze beiseite, es gibt momentan viel Hype um mathematische KI, aber was wir mehr brauchen, ist Strenge und Standardisierung. Wie Terence Tao betonte, können Unterschiede im Testformat, auch wenn die Ergebnisse ähnlich aussehen, einen großen Unterschied machen. Wir sind noch weit davon entfernt, klare, konsistente Standards und Botschaften in der KI-Forschung zu haben. Wenn wir bedeutende Fortschritte erzielen wollen, ist es an der Zeit, dass die Gemeinschaft aktiv wird. Lassen Sie uns Benchmarks erstellen, denen wir alle vertrauen können.
Jasper
Jasper19. Juli, 06:25
Vor nur 20 Minuten wurde das Ergebnis der IMO 2025 veröffentlicht. China belegte den 1. Platz und @GoogleDeepMind gewann eine Goldmedaille 🥇 Zukünftige Mathematikwettbewerbe werden China-Team gegen USA-Chinesisches Team gegen KI sein.
4,88K