Interessant tilnærming! Vi så imidlertid på bevisene og metodikken, og vi fant noen problemer, spesielt med bruken av hint gitt til modellen. Selv om stillaset faktisk forbedrer ytelsen, løser det ikke alle problemer nøyaktig og vil ikke få en gullmedalje. 🧵
Lin Yang
Lin Yang22. juli, 09:18
🚨 Olympiade matematikk + AI: Vi kjørte Googles Gemini 2.5 Pro på de ferske IMO 2025-problemene. Med nøye oppfordring og rørledningsdesign løste den 5 av 6 – bemerkelsesverdig for oppgaver som krever dyp innsikt og kreativitet. Modellen kan vinne gull! 🥇 #AI #Math #LLMs #IMO2025
28K