Statiska benchmarks är superviktiga, och @grok 4:s prestanda är utan tvekan imponerande. Jag väntar fortfarande på att se vad folk tycker om modellen när den är i deras händer. Kommer den att leva upp till förväntningarna? Till syvende och sist handlar det om verklig nytta för enskilda användare. Grok 4 är i händerna på våra miljontals användare på @lmarena_ai. Kan inte vänta med att se vad de tycker som ett första steg! På min sida har jag försökt ställa några svåra matematiska frågor, och @grok verkar göra det bra. Det är kortfattat och sakligt. Verkar supersmart och jag gillar att diskutera forskning med den här modellen. Kolla in det utbytbarhetsrelaterade beviset i den bifogade bilden! Ser ut som inga buggar ...
8,62K