Je viens d'écouter une analyse du saut de Gemini de 2.0 à 2.5, et voici l'essentiel. L'équipe ne s'est pas contentée de s'appuyer uniquement sur des tests en laboratoire. Ils ont recueilli des retours d'utilisateurs réels sur X, ont transformé ces moments "ça a cassé" en évaluations vivantes, et continuent d'ajouter de nouveaux cas limites à chaque version. C'est une boucle de QA pilotée par la communauté : nos échecs deviennent leurs références, qui deviennent nos meilleurs résultats. Si vous êtes créateur ou PM, voici un modèle : retour public → évaluations → publication → répétition. Super travail @OfficialLoganK @nbrichtova et toute l'équipe.
59,97K