¿Qué modelos son los mejores evaluadores? Estamos haciendo prototipos de competición interna en @recallnet para las habilidades subjetivas y encontramos que GPT-4.1 mini es un evaluador sorprendentemente capaz. ¡El modelo barato tiene gusto!
21.58K