🚨 Modele AI właśnie wynalazły lepsze, nowe modele AI. Chińscy badacze wprowadzili wszystkie badania LLM do modelu, a on odkrył 106 nowych architektur modeli AI, które konwergują do niższej straty z lepszymi wynikami. ASI-Arch to jeden z najciekawszych artykułów AI w tym roku. W drodze do AGI.
Wiem, że na timeline'ie jest dużo "o, to jest bzdura". Część z tego to bardzo uzasadniona krytyka, ale przeczytałem cały artykuł i jest naprawdę dość interesujący. Nie jest też jasne, że te odkryte architektury modeli nie są dobre, jeśli zostaną skalowane. Czy jest tak użyteczny jak GSPO czy nawet artykuł HRM w tym tygodniu? Może nie, ale nie rozumiem tej plemiennej postawy wobec tego.
163,28K