コード問題に対する低複雑度の解決策のための新しいベンチマークが必要です。 新機能の一つ一つがタワーの中のジェンガブロックのようなもので、現在のベンチマークは各ブロックの組み立ての良さしか評価していません。 タワーが崩壊する前にブロックをどれだけ積み上げられるかを追跡する評価が必要です。