Podsumowując ten tydzień: - wydaliśmy komputer ogólnego przeznaczenia z użyciem agenta - zostaliśmy pokonani przez jednego człowieka w konkursie heurystyk atcoder - rozwiązaliśmy 5/6 nowych problemów IMO z dowodami w języku naturalnym Wszystko to opiera się na tym samym pojedynczym systemie uczenia przez wzmocnienie.
116,38K