Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Saya tidak lagi yakin apa yang harus dipikirkan tentang buku ini.
Itu adalah buku yang fantastis selama sebagian besar ide-ide ini tampak berharga, tetapi juga bertanggung jawab atas beberapa kekejaman terbesar yang pernah saya saksikan.
Saya tidak lagi merekomendasikan orang untuk membacanya. Saya belum lama masuk.

21,15K
Ini adalah cara Anda menulis kode 10x lebih baik dengan usaha 10x lebih sedikit.
Agen khusus khusus yang meninjau kode Anda di setiap langkah.
Saya telah melihat tinjauan kode otomatis sebelumnya, tetapi tidak pernah dengan kemampuan untuk menentukan agen peninjau khusus Anda. @baz_scm adalah yang pertama melakukan ini, dan itu cukup keren.
Ada tiga jenis agen pengulas:
1. Yang keluar dari kotak.
Agen-agen ini mencakup pola paling umum yang ingin diperiksa semua orang: kode duplikat, kode rusak, kode kompleks, dll.
2. Agen reviewer yang direkomendasikan yang dibuat Baz untuk Anda secara otomatis.
Baz menganalisis riwayat ulasan dan komentar sebelumnya untuk mengidentifikasi pola yang Anda pedulikan, dan kemudian secara otomatis membuat agen yang berspesialisasi dalam memeriksa pola tersebut.
Misalnya, jika Anda selalu meminta pengembang Anda untuk menyimpan file di bawah 100 baris kode, Baz akan mendeteksinya dan membuat agen khusus yang memeriksanya.
3. Agen peninjau khusus yang Anda tentukan.
Ini adalah favorit saya: Tulis prompt yang menjelaskan aturan Anda, dan agen Anda akan mulai memeriksa kode Anda untuk menandai apa pun yang sesuai dengan aturan.
Saya membuat agen pengulas sederhana di video terlampir.
Sejujurnya, pada titik ini, Anda tidak punya alasan untuk mengirimkan kode yang buruk.
Berikut adalah tautan bagi Anda untuk mencoba agen peninjau khusus ini:
Terima kasih kepada tim @baz_scm karena telah berkolaborasi dengan saya dalam posting ini.
30,92K
Sejujurnya, sebagian besar pengembang AI masih terjebak di abad terakhir.
Itu mengejutkan saya betapa sedikit orang yang mengetahui Analisis Kesalahan.
Ini *secara harfiah* adalah cara tercepat dan paling efektif untuk mengevaluasi aplikasi AI, dan sebagian besar tim masih terjebak mengejar hantu.
Harap berhenti melacak metrik umum dan ikuti langkah-langkah berikut:
1. Kumpulkan sampel kegagalan
Mulailah meninjau respons yang dihasilkan oleh aplikasi Anda. Tulislah catatan tentang setiap tanggapan, terutama yang merupakan kesalahan. Anda tidak perlu memformat catatan Anda dengan cara tertentu. Fokus untuk menggambarkan apa yang salah dengan respons.
2. Kategorikan catatan Anda
Setelah Anda meninjau serangkaian tanggapan yang baik, ambil LLM dan minta untuk menemukan pola umum dalam catatan Anda. Mintalah untuk mengklasifikasikan setiap nada berdasarkan pola-pola ini.
Anda akan mendapatkan kategori yang mencakup setiap jenis kesalahan yang dibuat aplikasi Anda.
3. Mendiagnosis kesalahan yang paling sering terjadi
Mulailah dengan berfokus pada jenis kesalahan yang paling umum. Anda tidak ingin membuang waktu bekerja dengan kesalahan langka.
Telusuri percakapan, input, dan log yang mengarah ke sampel yang salah tersebut. Cobalah untuk memahami apa yang mungkin menyebabkan masalah.
4. Desain perbaikan yang ditargetkan
Pada titik ini, Anda ingin menentukan cara menghilangkan kesalahan yang Anda diagnosis pada langkah sebelumnya secepat dan semurah mungkin.
Misalnya, Anda dapat mengubah perintah, menambahkan aturan validasi tambahan, menemukan lebih banyak data pelatihan, atau memodifikasi model.
5. Mengotomatiskan proses evaluasi
Anda perlu menerapkan proses sederhana untuk menjalankan ulang kumpulan evaluasi melalui aplikasi Anda dan mengevaluasi apakah perbaikan Anda efektif.
Rekomendasi saya adalah menggunakan LLM-as-a-Judge untuk menjalankan sampel melalui aplikasi, menilainya dengan tag PASS/FAIL, dan menghitung hasilnya.
6. Awasi metrik Anda
Setiap kategori yang Anda identifikasi selama analisis kesalahan adalah metrik yang ingin Anda lacak dari waktu ke waktu.
Anda tidak akan mendapatkan apa-apa dengan terobsesi pada "relevansi", "kebenaran", "kelengkapan", "koherensi", dan metrik out-of-the-box lainnya. Lupakan ini dan fokuslah pada masalah nyata yang Anda temukan.

49,08K
Santiago memposting ulang
Ini adalah Kiro - IDE AI yang benar-benar bekerja pada proyek dunia nyata Anda yang berantakan. Alat AI lainnya kehilangan konteks ketika proyek menjadi rumit. Kiro memberi Anda pengembangan berbasis spesifikasi yang melampaui prototipe.
Pratinjau gratis tersedia sekarang
#KiroDotDev
215,74K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal