Statiske benchmarks er superviktige, og ytelsen til @grok 4 er uten tvil imponerende. Jeg venter fortsatt på å se hva folk synes om modellen når den er i hendene deres. Vil det leve opp til forventningene? Til syvende og sist handler det om reell nytte for individuelle brukere. Grok 4 er i hendene på våre millioner av brukere på @lmarena_ai. Gleder meg til å se hva de synes som et første skritt! På min side har jeg prøvd å stille noen vanskelige mattespørsmål, og @grok ser ut til å gjøre det bra. Det er kortfattet og saklig. Virker supersmart, og jeg liker å diskutere forskning med denne modellen. Sjekk ut det utskiftbarhetsrelaterte beviset i det vedlagte bildet! Ser ut som ingen feil...
8,6K