DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

2023: en OpenAI, algunas figuras clave en el post-entrenamiento estaban en contra de escalar RL. 2022: Eric/Yuhuai (ahora xAI) escribió STaR y yo escribí "LLM puede auto-mejorarse". Era evidente que RL en señales limpias desbloquea el siguiente salto. La división pre/post-entrenamiento puede haber sido una gran desaceleración para la IA.

34,75K

Parte superior

Clasificación

Favoritos

En tendencia on-chain

En tendencia en X

Principales fondos recientes

Más destacado