Tôi đang khởi động lại các đánh giá LLM của mình. Tôi sẽ tập trung vào các nhiệm vụ nghiên cứu tài chính. Những ý tưởng ban đầu: 1 • phân tích tâm lý tin tức 2 • tính toán tài chính 3 • phân tích 10-K, v.v. Tất cả mã sẽ được chia sẻ - vì mục tiêu là học hỏi. Tôi sẽ thử nghiệm cả các mô hình nhỏ và lớn. Tôi cũng sẽ tinh chỉnh các mô hình mã nguồn mở nhỏ và xem chúng so sánh như thế nào với các mô hình lớn trong các nhiệm vụ cụ thể! Các ý tưởng thí nghiệm rất được hoan nghênh.
Hình ảnh trên cho thấy các LLM tiên tiến. Thật ấn tượng với hiệu suất mà chúng ta nhận được từ Kimi K2 và DeepSeek R1, xét về giá cả. Tổng chi phí là chi phí đầu vào + chi phí token đầu ra. Hiệu suất là điểm ELO trong lĩnh vực LLM. Tôi sẽ định nghĩa các điểm ELO của riêng mình khi tôi thực nghiệm.
6,33K