🧵 Mengapa Templar tidak terburu-buru ke model yang lebih besar (dan mengapa strategi ini akan mendominasi) 0/ "Wen model yang lebih besar?" Kami mendapatkan pertanyaan ini terus-menerus. Inilah mengapa kami menyempurnakan model 8B terlebih dahulu—dan mengapa pendekatan ini akan menghancurkan persaingan ketika kami meningkatkan skala. Utas di bawah ini 👇
10,69K