Ventet på at dette skulle komme på Arxiv, men uansett hva Dario sier stemmer det overens med våre benchmarks på ROSClaw når vi tester agenter som har forskjellige roboter. Ulike modeller har ulike atferdskarakteristikker og bekymringer rundt samhandling med den virkelige verden. Veldig merkelig og interessant å observere