🚨GROK ĐẠT 26.9% TRONG "KỲ THI CUỐI CÙNG CỦA NHÂN LOẠI" MÀ KHÔNG CẦN CÔNG CỤ Biểu đồ tỷ lệ cho thấy câu chuyện: nhiều tính toán = hiệu suất tốt hơn. Grok đã vượt qua hơn một phần tư trong số các tiêu chuẩn học thuật khó nhất thế giới chỉ bằng lý luận thuần túy. Không có máy tính, không có sự trợ giúp bên ngoài. Chỉ có sức mạnh trí tuệ nhân tạo thô đối mặt với 2,500 câu hỏi trong mọi lĩnh vực tri thức của nhân loại. Hầu hết con người sẽ thất bại trong bài kiểm tra này ngay CÓ công cụ. Grok đang làm điều đó với mắt bị bịt. Nguồn: @xai @elonmusk
Mario Nawfal
Mario Nawfal12:14 10 thg 7
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed. Math dominates at 41%, followed by sciences and humanities. The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove? We're building the test that determines when machines officially outsmart us. Source: @xai @elonmusk
89,58K