Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Nie możesz nauczyć się tego, czego nie możesz spróbować. Zwiększ temperaturę, aby trenować bardziej ciekawskie agenty. Proste i skuteczne. Z "Trenowanie ogólnie ciekawskiego agenta": Projektujemy różnorodny zestaw zadań, w których agent LLM potrzebuje strategicznego gromadzenia informacji, aby odnieść sukces, a następnie trenujemy LLM na danych generowanych samodzielnie, aby preferował trajektorie o wyższej wydajności. Wyuczone zachowanie może być przenoszone zero-shot na niewidziane zadania, co pokazuje jego potencjał do budowania ogólnych agentów podejmujących decyzje.

232

Najlepsze

Ranking

Ulubione

Trendy onchain

Trendy na X

Niedawne największe finansowanie

Najbardziej godne uwagi