<Bây giờ không phải là mô hình, mà là dữ liệu đang cạnh tranh> Cốt lõi của ngành công nghiệp AI không còn là tính toán hay mô hình, mà là 'dữ liệu chất lượng cao.' Cũng như nền văn minh nhân loại đã tiến bộ nhờ dầu mỏ trong quá khứ, AI cũng cần một 'nhiên liệu' mới để tiến lên. Cũng như dầu mỏ đã được sử dụng như một nguồn năng lượng và vật liệu trước và sau Thế chiến II, dẫn đến sự công nghiệp hóa nhanh chóng, cách mà dữ liệu được bảo đảm và xử lý sẽ xác định vị thế lãnh đạo trong kỷ nguyên AI. Elon Musk cũng đã đề cập đến điều này vào đầu năm nay. "Chúng ta đã khai thác hết tổng hợp kiến thức của nhân loại trong việc học AI." Thật vậy, các mô hình như GPT đã phát triển nhanh chóng bằng cách thu thập dữ liệu công khai từ các trang web, sách, mã và hình ảnh. Tuy nhiên, bây giờ chúng ta cần những hình thức dữ liệu mới mà có thể được bảo vệ bản quyền hoặc không tồn tại chút nào. Ví dụ, trong các lĩnh vực như xe tự hành và robot, chúng ta cần dữ liệu phức tạp dựa trên sự tích hợp đa cảm biến, chẳng hạn như camera, radar và lidar, cũng như dữ liệu trường hợp được thu thập trong các môi trường thực tế, mà không tồn tại trên web. Vấn đề lớn hơn là 'làm thế nào để kết hợp chúng một cách tốt nhất' hơn là công nghệ bản thân. Hàng ngàn người cần thu thập, gán nhãn và cập nhật dữ liệu trong khi bị phân tán, và các phương pháp tập trung đã được sử dụng cho đến nay gặp khó khăn trong việc xử lý sự đa dạng và quy mô này. Do đó, ngành công nghiệp AI ngày càng hội tụ vào ý tưởng rằng một cách tiếp cận phi tập trung là giải pháp. Đây là lúc 'Poseidon (@psdnai)' phát huy vai trò. Poseidon không chỉ là một kho dữ liệu; nó là một cơ sở hạ tầng nhận, xác minh và tinh chế dữ liệu từ thế giới thực để tạo ra các tập dữ liệu huấn luyện có thể được sử dụng mà không lo ngại về bản quyền. Nói một cách ẩn dụ, Poseidon là một 'nhà máy lọc dầu.' Nó lấy dữ liệu thô và tinh chế nó thành nhiên liệu mà AI có thể sử dụng để học. Tất cả quá trình này hoạt động trên @StoryProtocol. Nó ghi lại một cách minh bạch trên chuỗi ai đã cung cấp dữ liệu, trong điều kiện nào, và ai đã sử dụng nó. Những người cung cấp dữ liệu nhận được sự bồi thường công bằng, và các nhà phát triển AI có thể sử dụng nó một cách yên tâm. Poseidon, sẽ đạt được sự đổi mới ở tầng dữ liệu thay vì thông qua GPU hoặc mô hình, có thể là ví dụ tốt nhất về việc áp dụng công nghệ web3 vào các ngành công nghiệp web2.
Chris Dixon
Chris Dixon00:18 23 thg 7
Rất vui mừng thông báo rằng chúng tôi đang dẫn dắt một vòng gọi vốn hạt giống trị giá 15 triệu đô la cho Poseidon, được ươm tạo bởi @StoryProtocol và đang xây dựng một lớp dữ liệu phi tập trung để phối hợp cung và cầu cho dữ liệu đào tạo AI. Thế hệ đầu tiên của các mô hình nền tảng AI đã được đào tạo trên dữ liệu dường như là một nguồn tài nguyên vô hạn. Ngày nay, những nguồn tài nguyên dễ tiếp cận nhất như sách và trang web đã hầu như bị khai thác hết, và dữ liệu đã trở thành yếu tố hạn chế trong sự tiến bộ của AI. Nhiều dữ liệu còn lại hiện nay hoặc có chất lượng thấp hơn hoặc bị hạn chế do bảo vệ quyền sở hữu trí tuệ. Đối với một số ứng dụng AI hứa hẹn nhất — trong lĩnh vực robot, xe tự hành và trí thông minh không gian — dữ liệu thậm chí còn chưa tồn tại. Giờ đây, những hệ thống này cần những loại thông tin hoàn toàn mới: đa giác quan, phong phú trong các trường hợp biên, được thu thập trong môi trường tự nhiên. Tất cả dữ liệu từ thế giới vật lý này sẽ đến từ đâu? Thách thức không chỉ là kỹ thuật — đó là một vấn đề phối hợp. Hàng ngàn người đóng góp phải làm việc cùng nhau theo cách phân tán để tìm nguồn, gán nhãn và duy trì dữ liệu vật lý mà AI thế hệ tiếp theo cần. Chúng tôi tin rằng không có cách tiếp cận tập trung nào có thể phối hợp hiệu quả việc tạo ra và quản lý dữ liệu cần thiết ở mức độ quy mô và đa dạng yêu cầu. Một cách tiếp cận phi tập trung có thể giải quyết điều này. @psdnai cho phép các nhà cung cấp thu thập dữ liệu mà các công ty AI cần, đồng thời đảm bảo an toàn quyền sở hữu trí tuệ thông qua giấy phép IP lập trình của Story. Điều này nhằm thiết lập một nền tảng kinh tế mới cho internet, nơi các nhà sáng tạo dữ liệu được đền bù công bằng cho việc giúp các công ty AI phát triển thế hệ hệ thống thông minh tiếp theo. Đội ngũ của Poseidon, do Giám đốc Khoa học và Đồng sáng lập @SPChinchali dẫn dắt, mang đến chuyên môn sâu về cơ sở hạ tầng AI. Sandeep là giáo sư tại UT Austin chuyên về AI, robot và hệ thống phân tán, với bằng tiến sĩ từ Stanford về AI và hệ thống phân tán. Giám đốc Sản phẩm và Đồng sáng lập @sarickshah đã dành một thập kỷ làm kỹ sư học máy, mở rộng các sản phẩm AI cho các doanh nghiệp lớn trong lĩnh vực dịch vụ tài chính, viễn thông và chăm sóc sức khỏe. Chúng tôi rất vui mừng được hỗ trợ Poseidon trong công việc giải quyết một trong những nút thắt quan trọng nhất trong sự phát triển của AI.
2,11K