Pracujeme s otevřeným zdrojovým kódem BrowseComp ("Soutěž v prohlížení"), což je nový náročný benchmark, který testuje, jak dobře dokážou agenti umělé inteligence procházet internet a hledat těžko lokalizovatelné informace. Je to jako online lov mrchožroutů... ale pro agenty procházení.
920,39K