Tocmai am ieșit de la serviciu și am încercat Grok-4 pe o problemă de topologie de licență. Mi-a luat 9 minute să mă gândesc și apoi a dat cu încredere un răspuns 😅 curat, plauzibil, dar total greșit Să nu credeți că acesta se califică drept "abil adversar". Modelele AI sunt repere zdrobitoare - dar încă un drum lung înainte pentru AGI matematică reală.
Elon Musk
Elon Musk10 iul., 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial. It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
663,01K