Meer waarnemingen van Nummer Vijf. Deze persoon heeft vroege toegang gekregen tot GPT-5-redenering (medium) voor testen.
leo 🐈
leo 🐈2 aug, 22:03
Zoals je hierboven misschien hebt opgemerkt, had ik vroegtijdig toegang tot een versie van GPT-5. Het stelt de nieuwe SoTA vast met een aanzienlijke marge op deze benchmark en presteert veel beter dan o3-high. Het is een geweldig model. Aan de andere kant blijft het beste model van Anthropic achter. Dat van Google zit in het midden van het pakket.
46,59K