một chút vượt quá khả năng của tôi vào lúc này nhưng đã nói chuyện với 5.4 và đến đây bằng cách nào đó quan điểm hình học đại số về transformers trong ML khá điên rồ
mẹo là bắt đầu từ một nơi nào đó hơi thú vị với 5.4 ("dẫn tôi qua microgpt của @karpathy") và cứ tiếp tục nói "có" cần điều khiển tối thiểu
427