Nueva investigación de Anthropic: “Escalado inverso en el cómputo de tiempo de prueba” Encontramos casos donde un razonamiento más largo conduce a una menor precisión. Nuestros hallazgos sugieren que la escalabilidad ingenua del cómputo de tiempo de prueba puede reforzar inadvertidamente patrones de razonamiento problemáticos. 🧵
143,44K