Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Tôi không còn chắc chắn nên nghĩ gì về cuốn sách này.
Nó là một cuốn sách tuyệt vời trong một thời gian khi hầu hết những ý tưởng này có vẻ có giá trị, nhưng nó cũng chịu trách nhiệm cho một số tội ác lớn nhất mà tôi đã chứng kiến.
Tôi không còn khuyên mọi người đọc nó nữa. Tôi đã không đọc nó trong một thời gian.

21,16K
Đây là cách bạn viết mã tốt hơn gấp 10 lần với nỗ lực ít hơn gấp 10 lần.
Các tác nhân chuyên biệt, tùy chỉnh sẽ xem xét mã của bạn từng bước một.
Tôi đã thấy các đánh giá mã tự động trước đây, nhưng chưa bao giờ có khả năng định nghĩa các tác nhân đánh giá tùy chỉnh của bạn. @baz_scm là người đầu tiên thực hiện điều này, và thật tuyệt vời.
Có ba loại tác nhân đánh giá:
1. Những tác nhân có sẵn ngay khi bạn sử dụng.
Các tác nhân này bao phủ những mẫu phổ biến nhất mà mọi người muốn kiểm tra: mã trùng lặp, mã bị hỏng, mã phức tạp, v.v.
2. Các tác nhân đánh giá được đề xuất mà Baz tự động tạo cho bạn.
Baz phân tích lịch sử đánh giá và các bình luận trước đó của bạn để xác định các mẫu mà bạn quan tâm, và sau đó tự động tạo ra các tác nhân chuyên biệt trong việc kiểm tra những mẫu đó.
Ví dụ, nếu bạn luôn yêu cầu các nhà phát triển của mình giữ cho các tệp dưới 100 dòng mã, Baz sẽ phát hiện điều đó và tạo ra một tác nhân tùy chỉnh để kiểm tra điều đó.
3. Các tác nhân đánh giá tùy chỉnh mà bạn định nghĩa.
Đây là những tác nhân tôi thích nhất: Viết một lời nhắc giải thích các quy tắc của bạn, và tác nhân của bạn sẽ bắt đầu kiểm tra mã của bạn để đánh dấu bất cứ điều gì phù hợp với các quy tắc đó.
Tôi đã tạo một tác nhân đánh giá đơn giản trong video đính kèm.
Thật lòng mà nói, đến thời điểm này, bạn không có lý do gì để gửi mã kém.
Dưới đây là một liên kết để bạn thử các tác nhân đánh giá tùy chỉnh này:
Cảm ơn đội ngũ @baz_scm đã hợp tác với tôi trong bài viết này.
30,92K
Thật lòng mà nói, hầu hết các nhà phát triển AI vẫn đang mắc kẹt trong thế kỷ trước.
Thật không thể tin nổi là có rất ít người nhận thức được Phân tích Lỗi.
Đây *thực sự* là cách nhanh nhất và hiệu quả nhất để đánh giá các ứng dụng AI, và hầu hết các đội ngũ vẫn đang mắc kẹt trong việc theo đuổi những điều vô hình.
Xin hãy ngừng theo dõi các chỉ số chung và làm theo các bước sau:
1. Thu thập mẫu lỗi
Bắt đầu xem xét các phản hồi được tạo ra bởi ứng dụng của bạn. Ghi chú về từng phản hồi, đặc biệt là những phản hồi sai. Bạn không cần phải định dạng ghi chú của mình theo cách cụ thể nào. Tập trung vào việc mô tả những gì đã sai với phản hồi.
2. Phân loại ghi chú của bạn
Sau khi bạn đã xem xét một bộ phản hồi tốt, hãy lấy một LLM và yêu cầu nó tìm các mẫu chung trong ghi chú của bạn. Hãy yêu cầu nó phân loại từng ghi chú dựa trên những mẫu này.
Bạn sẽ có được các danh mục bao phủ mọi loại lỗi mà ứng dụng của bạn đã mắc phải.
3. Chẩn đoán những lỗi thường gặp nhất
Bắt đầu bằng cách tập trung vào loại lỗi phổ biến nhất. Bạn không muốn lãng phí thời gian làm việc với những lỗi hiếm gặp.
Đi sâu vào các cuộc trò chuyện, đầu vào và nhật ký dẫn đến những mẫu sai đó. Cố gắng hiểu điều gì có thể gây ra các vấn đề.
4. Thiết kế các biện pháp khắc phục mục tiêu
Tại thời điểm này, bạn muốn xác định cách loại bỏ những lỗi mà bạn đã chẩn đoán ở bước trước một cách nhanh chóng và tiết kiệm nhất có thể.
Ví dụ, bạn có thể điều chỉnh các gợi ý của mình, thêm các quy tắc xác thực bổ sung, tìm thêm dữ liệu đào tạo hoặc sửa đổi mô hình.
5. Tự động hóa quy trình đánh giá
Bạn cần triển khai một quy trình đơn giản để chạy lại một bộ đánh giá qua ứng dụng của bạn và đánh giá xem các biện pháp khắc phục của bạn có hiệu quả hay không.
Khuyến nghị của tôi là sử dụng LLM như một Người Đánh Giá để chạy các mẫu qua ứng dụng, chấm điểm chúng với thẻ PASS/FAIL và tính toán kết quả.
6. Theo dõi các chỉ số của bạn
Mỗi danh mục bạn đã xác định trong quá trình phân tích lỗi là một chỉ số bạn muốn theo dõi theo thời gian.
Bạn sẽ không đi đến đâu nếu cứ ám ảnh về "tính liên quan", "độ chính xác", "độ hoàn chỉnh", "tính mạch lạc", và bất kỳ chỉ số nào khác ngoài lề. Quên đi những điều này và tập trung vào những vấn đề thực sự mà bạn đã tìm thấy.

49,09K
Santiago đã đăng lại
Đây là Kiro - IDE AI thực sự hoạt động trên các dự án thực tế lộn xộn của bạn. Các công cụ AI khác mất ngữ cảnh khi các dự án trở nên phức tạp. Kiro cung cấp cho bạn phát triển dựa trên đặc tả có thể mở rộng vượt ra ngoài các nguyên mẫu.
Xem trước miễn phí hiện có
#KiroDotDev
215,74K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất