Es ist überraschend schwierig herauszufinden, ob OpenAI und Google DeepMind tatsächlich einen IMO Gold "fair und square" erhalten haben oder nicht. Ich freue mich auf weitere Analysen.
Jasper Dekoninck
Jasper Dekoninck22. Juli, 17:20
Interessanter Ansatz! Wir haben jedoch die Beweise und die Methodik betrachtet und einige Probleme festgestellt, insbesondere mit der Verwendung von Hinweisen, die dem Modell gegeben wurden. Während das Gerüst die Leistung tatsächlich verbessert, löst es nicht alle Probleme genau und würde keine Goldmedaille erhalten.🧵
1,3K