Het is verrassend moeilijk om te achterhalen of OpenAI en Google DeepMind daadwerkelijk een IMO Gold "eerlijk en rechtvaardig" hebben gekregen of niet. Ik kijk uit naar meer analyses.
Jasper Dekoninck
Jasper Dekoninck22 jul, 17:20
Interessante benadering! We hebben echter naar de bewijzen en de methodologie gekeken en we hebben een paar problemen gevonden, specifiek met het gebruik van hints die aan het model zijn gegeven. Hoewel de scaffold inderdaad de prestaties verbetert, lost het niet alle problemen nauwkeurig op en zou het geen gouden medaille krijgen.🧵
1,35K