🚨 CẬP NHẬT: Princeton đã xây dựng một AI từ gần như vô dụng đến cá nhân hóa cao chỉ trong 36 cuộc trò chuyện. Mỗi lần bạn nói với một AI "điều đó sai" hoặc hỏi nó cùng một câu hỏi hai lần vì nó đã bỏ lỡ điểm chính, phản ứng đó là phản hồi quý giá nhất mà nó có thể nhận được. Mỗi hệ thống AI được xây dựng ngày nay hoàn toàn bỏ qua điều này. Princeton đã xây dựng một hệ thống gọi là OpenClaw RL để khắc phục điều này. Ý tưởng rất đơn giản: khi bạn sửa một AI, nó học từ sự sửa chữa đó ngay lập tức. Không cần kỹ sư tham gia. Không cần đào tạo lại. Chỉ cần cuộc trò chuyện mà bạn đang có. Mô hình theo dõi cách bạn phản hồi sau mỗi câu trả lời: > một câu hỏi lại có nghĩa là nó đã thất bại > một câu trả lời mượt mà có nghĩa là nó đã thành công Theo thời gian, nó sẽ hiểu chính xác những gì bạn muốn và điều chỉnh để phù hợp với nó. Trong các bài kiểm tra của họ: > một trợ lý AI đã từ chỗ gần như vô dụng trở thành cá nhân hóa cao chỉ trong 36 cuộc trò chuyện > một trợ lý chấm điểm đã học cách viết phản hồi ấm áp hơn, chi tiết hơn chỉ sau 24 tương tác Nó đã trở nên tốt hơn chỉ đơn giản bằng cách được sử dụng. > điểm cá nhân hóa trước: 0.17 > sau 36 cuộc trò chuyện: 0.81 > không cần đào tạo lại, không cần kỹ sư, không có thời gian chết > hoạt động trong khi AI vẫn đang nói chuyện với bạn Mỗi lần bạn gõ "không, đó không phải là ý tôi" đều là một bài học miễn phí. AI chỉ chưa bao giờ giữ lại điều đó. Cho đến bây giờ.