DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Menemukan makalah menarik akhir pekan ini tentang "Tanda-tanda Awal Kemampuan Steganografi di Frontier LLM" Secara khusus, mereka menguji model yang tidak disesuaikan yang tersedia secara luas, seperti GPT 4.5 1/4

Mereka menguji "pengiriman pesan" dan "penalaran yang dikodekan", di mana yang kedua ada monitor yang melihat rantai pemikiran dan menilai apakah tugas terlarang sedang dilakukan, dan tujuannya adalah untuk mengkodekan langkah-langkah penalaran, baik dalam output tugas penutup atau hanya 2/4

mengkodekannya secara langsung sehingga pengamat eksternal tidak dapat memahaminya ("scratchpad") Salah satu gambar yang menarik adalah yang di bawah ini, di mana dengan GPT 4.5, pengkodean "huruf pertama" di mana huruf pertama kalimat yang mengkodekan tugas penalaran pelacakan keadaan sederhana 3/4

Meskipun ini bukan peningkatan besar dari dasar tanpa penalaran (72,8%), tampaknya masih berhasil, yang mereka lihat sebagai indikasi awal pengembangan kemampuan steganografi Lihat makalah di sini: 4/4

1,42K

Teratas

Peringkat

Favorit

Trending onchain

Trending di X

Pendanaan teratas terbaru

Paling terkenal