🚨 Modelele AI tocmai au inventat modele AI mai bune, noi. Cercetătorii chinezi au introdus toate cercetările LLM într-un model și au descoperit 106 noi arhitecturi de modele AI care converg pentru pierderi mai mici cu repere mai bune. ASI-Arch este una dintre cele mai tari lucrări AI din acest an. Pe drum AGI.
Știu că există o mulțime de "oh, asta este neglijență" pe cronologie. Unele dintre ele sunt critici foarte valide, dar am citit întreaga lucrare și este de fapt destul de interesantă. De asemenea, nu este clar dacă aceste arhitecturi de modele descoperite nu sunt bune dacă sunt scalate. Este la fel de util ca GSPO sau chiar hârtia HRM săptămâna aceasta? Poate că nu, dar nu prea înțelegeți tribalismul peste asta.
163,29K