Interesujące podejście! Jednak przyjrzeliśmy się dowodom i metodologii i znaleźliśmy kilka problemów, szczególnie z użyciem wskazówek podanych modelowi. Chociaż rusztowanie rzeczywiście poprawia wydajność, nie rozwiązuje wszystkich problemów dokładnie i nie zdobyłoby złotego medalu.🧵
Lin Yang
Lin Yang22 lip, 09:18
🚨 Matematyka olimpijska + AI: Uruchomiliśmy Google’a Gemini 2.5 Pro na świeżych problemach IMO 2025. Przy starannym podpowiadaniu i projektowaniu pipeline'u, rozwiązał 5 z 6 — to niezwykłe w przypadku zadań wymagających głębokiego wglądu i kreatywności. Model mógłby zdobyć złoto! 🥇 #AI #Matematyka #LLMs #IMO2025
28K