Det er overraskende vanskelig å finne ut om OpenAI og Google DeepMind faktisk fikk et IMO Gold "fair and square" eller ikke. Ser frem til mer analyse.
Jasper Dekoninck
Jasper Dekoninck22. juli, 17:20
Interessant tilnærming! Vi så imidlertid på bevisene og metodikken, og vi fant noen problemer, spesielt med bruken av hint gitt til modellen. Selv om stillaset faktisk forbedrer ytelsen, løser det ikke alle problemer nøyaktig og vil ikke få en gullmedalje. 🧵
1,35K