🚨GROK 4 KROSSAR ARC-AGI BENCHMARK MED 60,6% Resonemangstestet som förbryllar de flesta AI:er har precis mött sin överman. Grok 4 nådde 60,6 % på ARC-AGI, vilket gjorde att OpenAI:s bästa låg på 41,0 % och alla andra på ensiffriga tal. Kostnad per uppgift? Bara $18. Claude behöver 107 dollar för sämre resultat. Det här riktmärket testar abstrakt resonemang - den typ som människor använder för att lösa pussel som de aldrig har sett förut. Grok har precis bevisat att de tänker annorlunda. Källa: @xai @elonmusk
Mario Nawfal
Mario Nawfal10 juli 12:46
🚨XAI SLÄPPER "EVE" RÖSTMODELL MED BRITTISK ACCENT SOM VISKAR OCH SJUNGER Möt Eve: xAI:s svar på att göra AI-konversationer faktiskt trevliga. Kommer med en elegant brittisk accent eftersom tydligen amerikanska AI-röster inte var tillräckligt sofistikerade. Kan viska hemligheter, sjunga låtar och föra konversationer som inte låter som robotkundtjänst. Källa: @xai @elonmusk
62,64K