Gefeliciteerd aan het GDM-team met hun IMO-resultaat! Ik denk dat hun parallelle succes benadrukt hoe snel de vooruitgang in AI is. Hun aanpak was iets anders dan de onze, maar ik denk dat dat laat zien dat er veel onderzoeksrichtingen zijn voor verdere vooruitgang. Enkele gedachten over ons model en onze resultaten 🧵
Ongeveer 2 maanden geleden heeft de IMO ons gemaild over deelname aan een formele (Lean) versie van de IMO. We hebben ons gericht op algemeen redeneren in natuurlijke taal zonder de beperkingen van Lean, dus we hebben geweigerd. We zijn nooit benaderd over een optie voor wiskunde in natuurlijke taal.
In de afgelopen maanden hebben we veel vooruitgang geboekt op het gebied van algemeen redeneren. Dit hield in dat we hoogwaardige wiskundedata hebben verzameld, gecureerd en getraind, die ook in toekomstige modellen zullen worden gebruikt. In onze IMO-evaluatie hebben we geen RAG of andere tools gebruikt.
Voordat we onze resultaten deelden, spraken we met een lid van de IMO-raad, die ons vroeg te wachten tot na de prijsuitreiking om het openbaar te maken, een verzoek dat we graag hebben geëerd.
We hebben rond 1 uur 's nachts PT (18:00 AEST) aangekondigd, nadat de prijsuitreiking was afgelopen. Op geen enkel moment heeft iemand gevraagd om later aan te kondigen.
Meer dan wat ook, zijn we enthousiast om onze vooruitgang en resultaten met de wereld te delen. De redeneercapaciteiten van AI vorderen snel, en deze IMO-resultaten tonen dat echt aan.
252,49K