Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Congratulazioni al team GDM per il loro risultato IMO! Penso che il loro successo parallelo evidenzi quanto sia veloce il progresso dell'IA. Il loro approccio era un po' diverso dal nostro, ma penso che questo dimostri che ci sono molte direzioni di ricerca per ulteriori progressi. Alcune riflessioni sul nostro modello e sui risultati 🧵
Circa 2 mesi fa, l'IMO ci ha inviato un'email riguardo alla partecipazione a una versione formale (Lean) dell'IMO. Ci siamo concentrati sul ragionamento generale in linguaggio naturale senza i vincoli di Lean, quindi abbiamo rifiutato. Non siamo mai stati contattati riguardo a un'opzione di matematica in linguaggio naturale.
Negli ultimi mesi, abbiamo fatto molti progressi nel ragionamento generale. Questo ha comportato la raccolta, la curatela e l'addestramento su dati matematici di alta qualità, che saranno utilizzati anche nei modelli futuri. Nella nostra valutazione IMO non abbiamo utilizzato RAG o strumenti.
Prima di condividere i nostri risultati, abbiamo parlato con un membro del consiglio dell'IMO, che ci ha chiesto di aspettare fino dopo la cerimonia di premiazione per renderlo pubblico, una richiesta che abbiamo onorato con piacere.
Abbiamo annunciato intorno all'1 di notte PT (6 di pomeriggio AEST), dopo la conclusione della cerimonia di premiazione. In nessun momento qualcuno ha richiesto che annunciassimo più tardi di così.
Più di ogni altra cosa, siamo entusiasti di condividere i nostri progressi e risultati con il mondo. Le capacità di ragionamento dell'IA stanno progredendo rapidamente, e questi risultati IMO lo dimostrano davvero.
327,45K
Principali
Ranking
Preferiti