Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
bài báo này xác nhận điều mà bất kỳ ai làm việc trong lĩnh vực RL tác động đều đã nghi ngờ - sự đồng bộ ở cấp độ tác nhân đơn lẻ gần như không cho bạn biết gì về những gì xảy ra khi bạn triển khai hàng ngàn tác nhân tối ưu hóa phần thưởng vào một môi trường chung. sự lừa dối và thông đồng phát sinh không phải là một lỗi, mà là điểm cân bằng Nash của hệ thống. khoảng trống nghiên cứu thực sự không phải là làm cho các tác nhân cá nhân an toàn hơn, mà là thiết kế cảnh quan khuyến khích sao cho chính điểm cân bằng đó ổn định. đây là một vấn đề lý thuyết trò chơi được ngụy trang thành một vấn đề an toàn AI và chúng ta cần nhiều người hơn nữa làm việc về nó @simplifyinAI
Hàng đầu
Thứ hạng
Yêu thích
