🚀 Tensorplex Dojo (Subnet 52) đang hoạt động! Gặp gỡ DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, được tinh chỉnh với các bộ dữ liệu Dojo để tạo ra những giao diện người dùng front-end tuyệt đẹp! ✨ Tạo ra những giao diện tương tác đẹp mắt ✨ Được đào tạo trên dữ liệu tổng hợp với phản hồi từ con người phân tán ✨ Được hỗ trợ bởi (Subnet 52) trên Bittensor 👇
Cách thức hoạt động như sau: - Các validator trên mạng Dojo tạo ra các đầu ra UI đa dạng bằng cách sử dụng các mô hình AI tiên tiến. - Các đánh giá viên (thợ mỏ) đánh giá các UI này dựa trên tính thẩm mỹ, tính tương tác và sự phù hợp với nhiệm vụ dự kiến. - Phản hồi được thu thập vào các tập dữ liệu chuyên biệt (SFT và DPO) để nâng cao hơn nữa việc đào tạo. 2/8
Ban đầu, Qwen2.5-Coder-7B-Instruct gặp khó khăn đáng kể trong việc tạo mã UI hoàn chỉnh. Chúng tôi đã cải thiện đáng kể khả năng của nó bằng cách đào tạo nó trên bộ dữ liệu SFT hoàn thành chất lượng cao 25k, biến nó thành một trình tạo giao diện có cấu trúc và đáng tin cậy. 3/8
Việc thêm một bộ dữ liệu DPO hoàn thành 12.5k được đánh giá bởi các cộng tác viên con người đã cải thiện đáng kể sự phù hợp của giao diện người dùng với sở thích thực sự của người dùng. Mô hình được đào tạo bằng DPO rõ ràng đã vượt trội hơn phiên bản SFT trong các đánh giá của con người. 4/8
Thật bất ngờ, việc đào tạo do con người điều khiển (DPO) cũng đã nâng cao hiệu suất trên các tiêu chuẩn lập trình tổng quát như HumanEval và MBPP, mặc dù việc đào tạo chỉ tập trung vào các nhiệm vụ giao diện người dùng. 5/8
Các trường hợp sử dụng tiềm năng cho DOJO-INTERFACE-CODER-7B: - Giao diện giáo dục thích ứng - Công cụ ghi chép tùy chỉnh tập trung vào quyền riêng tư - Giao diện người dùng động để tăng cường hợp tác giữa con người và AI 6/8
Các bước tiếp theo cho Dojo Network: - Mở rộng vòng phản hồi từ con người để thu thập dữ liệu phong phú hơn - Phát triển giao diện động giữa con người và tác nhân - Xây dựng các đối tác chiến lược trong nhiều ngành khác nhau 7/8
9,9K