Магазин DApp | Web3-центр мероприятий и игр | Кошелек OKX

Актуальные темы

В последние два месяца я не так много твитил, так как проводил время, изучая и экспериментируя с различными техниками RL. С нетерпением жду возможности поделиться некоторыми наработками: 1. Оптимальный рецепт для обучения GRPO 2. Инструмент на основе RL для повышения конфиденциальности в взаимодействиях с LLM Эксперименты были многообещающими 👀

3,76K

Топ

Рейтинг

Избранное

В тренде ончейн

В тренде в Х

Самые инвестируемые

Наиболее известные