Net van mijn werk gekomen en heb Grok-4 geprobeerd op een onderbouw topologieprobleem. Het duurde 9 minuten om na te denken en toen gaf het zelfverzekerd een schoon, plausibel, maar totaal verkeerd antwoord 😅 Denk niet dat dit kwalificeert als "vaardig vijandig." AI-modellen verpletteren benchmarks — maar er is nog een lange weg te gaan voor echte wiskundige AGI.
Elon Musk
Elon Musk10 jul, 16:47
Grok 4 is op het punt waar het in wezen nooit meer wiskunde/fysica-examenvragen fout heeft, tenzij ze vakkundig tegenstrijdig zijn. Het kan fouten of ambiguïteiten in vragen identificeren, en vervolgens de fout in de vraag corrigeren of elke variant van een ambiguïteit beantwoorden.
663,03K