RIP RAG phẳng ☠️ ByteDance vừa mã nguồn mở OpenViking và nó phơi bày mọi thứ sai lầm trong cách chúng ta đã xây dựng bộ nhớ của AI agent. Đây là những gì mà mọi khung agent đều sai: Ký ức sống ở một nơi. Tài nguyên ở nơi khác. Kỹ năng rải rác khắp nơi. Và khi bạn cần ngữ cảnh, bạn đang thực hiện tìm kiếm vector phẳng và hy vọng cho điều tốt nhất. Đó là vấn đề. OpenViking sửa chữa tất cả với một ý tưởng: coi ngữ cảnh của agent như một hệ thống tệp. Mọi thứ sống dưới giao thức viking:// thống nhất. Ký ức, tài nguyên, kỹ năng đều được tổ chức trong các thư mục với các URI duy nhất. Các agent có thể ls, tìm và điều hướng ngữ cảnh như một lập trình viên làm việc với terminal. Nhưng bước đột phá thực sự là tải theo cấp độ: → L0: tóm tắt một câu cho việc tra cứu nhanh → L1: ~2k token tổng quan cho quyết định lập kế hoạch → L2: chi tiết đầy đủ chỉ được tải khi thực sự cần thiết Hầu hết các agent đổ mọi thứ vào ngữ cảnh và cầu nguyện. OpenViking chỉ tải những gì cần thiết, khi cần thiết. Chi phí token giảm. Độ chính xác tăng lên. Và việc truy xuất thực sự có ý nghĩa bây giờ. Thay vì một tìm kiếm ngữ nghĩa phẳng, nó thực hiện định vị cấp thư mục trước, sau đó tinh chỉnh đệ quy bên trong các thư mục có điểm số cao. Bạn có thể theo dõi quỹ đạo truy xuất một cách rõ ràng, không còn hộp đen nữa. Phần tự tiến hóa cũng thật điên rồ. Vào cuối mỗi phiên, nó tự động trích xuất những bài học và cập nhật bộ nhớ của agent và người dùng. Agent chỉ trở nên thông minh hơn khi bạn sử dụng nó nhiều hơn. 9K sao. 13 người đóng góp. Được xây dựng bởi đội Viking của ByteDance, những người đã vận hành cơ sở hạ tầng vector từ năm 2019. 100% Mã nguồn mở. Apache 2.0. Liên kết trong bình luận.