Kiểm tra chất lượng thủ công không phù hợp với các pipeline dữ liệu hiện đại—quá chậm, quá đắt, quá dễ bị hỏng. @Hivemapper ban đầu đã xây dựng một nền tảng dữ liệu kiểm tra bản đồ dựa trên con người lớn với hơn 20.000 biên tập viên. Chúng tôi đã xóa 85% nền tảng này trong 6 tháng qua và thay thế nó bằng nhiều khả năng AI khác nhau. Có ba phần chính của nền tảng AI mới 1. AI Validators Các Validator có trách nhiệm đảm bảo độ chính xác của dữ liệu cho giới hạn tốc độ, giá xăng, các hạn chế về chiều cao, chiều rộng đường và nhiều hơn nữa. Họ cơ bản là người chấm điểm bài tập về nhà mà Bee thực hiện, và khi Bee mắc lỗi trong việc ghi nhận một giới hạn tốc độ là 25 mph thay vì 35 mph thì nó sẽ sửa lại. Có nhiều mô hình được chạy và tất cả cần đạt được sự đồng thuận. Ở đây, hầu hết các mô hình AI hoạt động tốt, và chúng tôi đã thấy hiệu suất xuất sắc ngay cả khi sử dụng các mô hình cũ hơn từ OpenAI và Phi. Hiện tại, chúng tôi không khuyến nghị Claude cho các nhiệm vụ xác thực AI dựa trên hình ảnh này. 2. AI Positioning Điều này hơi phức tạp hơn, nhưng cơ bản chúng tôi muốn đảm bảo rằng các đối tượng được định vị tốt và các biển báo được gán cho các làn đường đúng với phương vị chính xác. Hầu hết các mô hình AI cơ bản vẫn chưa có cảm nhận mạnh mẽ về không gian ba chiều, nhưng chúng tôi kỳ vọng điều này sẽ thay đổi sớm. Kevin Weil, CPO tại OpenAI đã nói, "Các mô hình AI mà bạn đang sử dụng hôm nay là những mô hình AI tồi tệ nhất mà bạn sẽ sử dụng trong suốt phần đời còn lại của mình." Cách tiếp cận của chúng tôi ở đây là phát hiện các lỗi định vị rõ ràng, có nghĩa là có một giới hạn tốc độ ở giữa đường không, có một cột điện trong ranh giới của một tòa nhà không, có một biển dừng không được căn chỉnh với một giao lộ không, v.v. Có những kỹ thuật khác ở đây mà tôi sẽ để dành cho một bài viết khác. 3. AI Re-Training Bee đang chạy các mô hình AI dựa trên suy diễn để xây dựng bản đồ ở rìa. Tuy nhiên, chúng tôi trước tiên đào tạo các mô hình này trên đám mây và điều quan trọng ở đây là tìm ra các trường hợp biên thú vị giúp giảm thiểu lỗi trong tương lai. Ví dụ, một biển báo giới hạn tốc độ 55 mph gắn vào phía sau một chiếc xe tải như hình dưới đây không phải là một biển báo giới hạn tốc độ tĩnh. Bối cảnh xung quanh các đối tượng này cho chúng tôi biết rất nhiều về chính các đối tượng đó và vì vậy chúng tôi đang dạy các mô hình AI của Bee hiểu bối cảnh này. Về cơ bản, bạn cần hàng trăm triệu km đường để thấy một số lượng đáng kể các trường hợp biên. Thật tốt khi Hivemapper có điều đó.
2,92K