🚨 I modelli di intelligenza artificiale hanno appena inventato modelli di intelligenza artificiale migliori e nuovi. I ricercatori cinesi hanno alimentato tutta la ricerca sui LLM in un modello e ha scoperto 106 nuove architetture di modelli di intelligenza artificiale che convergono a una perdita inferiore con migliori benchmark. ASI-Arch è uno dei documenti di intelligenza artificiale più interessanti di quest'anno. In rotta verso l'AGI.
So che c'è molto "oh, questo è spazzatura" sui social. Alcune di queste critiche sono molto valide, ma ho letto l'intero documento ed è in realtà piuttosto interessante. Non è nemmeno chiaro che queste architetture di modello scoperte non siano buone se scalate. È utile quanto il documento GSPO o anche quello HRM di questa settimana? Forse no, ma non capisco davvero il tribalismo al riguardo.
163,28K