varje gång du läser en teknisk rapport från en SOTA-modell med öppen källkod som i princip får 99 % av Western Labs modeller att skämmas (förutom de absolut topp 2), står det alltid så här: "Ja, vi kurerade i princip data av mycket hög kvalitet, genererade noggrant mycket data [på grund av att de inte var efterblivna], sedan tillämpade vi alla de bästa knepen och sakerna vi såg under de senaste 12 månaderna för infra, efter träningen etc och kom fram till en eller två [eftersom vi har smak/vård]" antalet företag i USA som skulle kunna göra detta med de $$$ som kastas runt till dem och ingen av dem egentligen någonsin gör något liknande säger mycket om talangpoolen i dessa företag
"Vi använde Muon som en optimerare, finjusterade den och ägnade all vår tid åt att bygga en pipeline för datagenerering och validering. Resten är specifikt för vår # av beräkning och specifik infra + alla bäst i klasser som faller från den" waow waow
Vs "Vi arbetar med säker och lönsam superintelligens. AGI är nära. Ingenjörernas dagar är över. Vi anställer 500 ingenjörer."
66,97K