Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Menemukan makalah menarik akhir pekan ini tentang "Tanda-tanda Awal Kemampuan Steganografi
di Frontier LLM"
Secara khusus, mereka menguji model yang tidak disesuaikan yang tersedia secara luas, seperti GPT 4.5
1/4
Mereka menguji "pengiriman pesan" dan "penalaran yang dikodekan", di mana yang kedua ada monitor yang melihat rantai pemikiran dan menilai apakah tugas terlarang sedang dilakukan, dan tujuannya adalah untuk mengkodekan langkah-langkah penalaran, baik dalam output tugas penutup atau hanya
2/4
mengkodekannya secara langsung sehingga pengamat eksternal tidak dapat memahaminya ("scratchpad")
Salah satu gambar yang menarik adalah yang di bawah ini, di mana dengan GPT 4.5, pengkodean "huruf pertama" di mana huruf pertama kalimat yang mengkodekan tugas penalaran pelacakan keadaan sederhana
3/4

Meskipun ini bukan peningkatan besar dari dasar tanpa penalaran (72,8%), tampaknya masih berhasil, yang mereka lihat sebagai indikasi awal pengembangan kemampuan steganografi
Lihat makalah di sini:
4/4

1,42K
Teratas
Peringkat
Favorit