Saya ingat sangat terkesan ketika saya menambahkan model transformator XL Yang Zhilin sebagai model ketiga di perpustakaan transformator pada awal 2019 tidak heran dia sekarang mengirimkan hal-hal yang mengesankan dengan Moonshot AI ini adalah cerita panjang yang harus saya ceritakan suatu hari nanti, tetapi di satu sisi, tim Google kecil ini adalah salah satu yang pertama benar-benar memahami kekuatan penskalaan data pelatihan
14,28K