Tebakan terbaik saya: Rubrik + Hakim LLM - Atomisasi setiap titik dalam bukti kebenaran tanah dan periksa terhadap output model Tebakan saya tentang bagaimana mereka membuat ini dapat diskalakan - karena sebelumnya tidak, manusia harus membuatnya dengan cermat, apakah mereka melatih atau melakukan sesuatu untuk membuat rubrik yang sangat bagus yang dihasilkan untuk setiap masalah spesifik atau jawabannya.
Alexander Wei
Alexander Wei19 Jul, 15.50
5/N Selain hasilnya sendiri, saya senang dengan pendekatan kami: Kami mencapai tingkat kemampuan ini bukan melalui metodologi khusus tugas yang sempit, tetapi dengan membuka jalan baru dalam pembelajaran penguatan tujuan umum dan penskalaan komputasi waktu pengujian.
.@polynoamial @alexwei_ berkedip dua kali jika saya benar dan 3 kali jika saya salah - sebelum buta dipimpin oleh buta xD
21,99K