Potrzebujemy nowych benchmarków dla rozwiązań o niskiej złożoności do problemów kodowania. Każda nowa funkcja jest jak klocek jenga w wieży, a obecne benchmarki tylko oceniają, jak dobrze każdy klocek jest złożony. Potrzebujemy ocen, które śledzą, jak wysoko można ułożyć klocki, zanim wieża się zawali.