Untuk meringkas minggu ini: - Kami merilis komputer tujuan umum menggunakan agen - Dikalahkan oleh satu manusia dalam kompetisi heuristik atcoder - memecahkan 5/6 masalah IMO baru dengan bukti bahasa alami Semua itu didasarkan pada sistem pembelajaran penguatan tunggal yang sama
116,38K