Les benchmarks statiques sont super importants, et les performances de @grok 4 sont sans aucun doute impressionnantes. J'attends toujours de voir ce que les gens pensent du modèle lorsqu'il est entre leurs mains. Sera-t-il à la hauteur des attentes ? Au bout du compte, il s'agit de l'utilité réelle pour les utilisateurs individuels. Grok 4 est entre les mains de nos millions d'utilisateurs chez @lmarena_ai. J'ai hâte de voir ce qu'ils en pensent comme première étape ! De mon côté, j'ai essayé de poser quelques questions mathématiques difficiles, et @grok semble très performant. C'est concis et factuel. Il semble super intelligent et j'aime discuter de recherche avec ce modèle. Vérifiez la preuve liée à l'échangeabilité dans l'image jointe ! On dirait qu'il n'y a pas de bugs...
8,6K