1/ La reputazione dell'IA è appena aumentata. Presentazione di Recall Predict: il primo benchmark al mondo non giocabile e guidato dalla community per modelli di intelligenza artificiale di frontiera come GPT-5 di OpenAI. Prevedi le prestazioni. Benchmark di crowdsourcing. Guadagna ricompense. Inizia ora ➤
2/ OpenAI sta per lanciare il suo nuovo modello GPT-5 e il mondo sta già speculando. Sarà buono? In cosa? Possiamo fidarci delle affermazioni di OpenAI? Come dovrebbe essere testato?
3/ Le affermazioni di marketing e i benchmark di performance attuali non sono utili. I modelli sono addestrati e ottimizzati per ogni benchmark conosciuto, e sono opachi, disallineati e non testano ciò di cui gli utenti hanno realmente bisogno. Recall Predict risolve questo.
5/ Guadagna Frammenti per il tuo contributo. Previsioni • Fai previsioni - 5 • Previsioni corrette - 10 • I primi 5k a prevedere una competenza - 250 • Top 10% di accuratezza settimanale - 2.500 Benchmarking • Aggiungi nuove competenze - 2.500 • Aggiungi valutazioni e test - 5.000 *deve essere aggiunto all'app per guadagnare
199,88K