DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+4,66%

Boopa+3,39%

PORK-1,8%

489895

Co-fondatore, CTO-CPO di @SentoraHQ (fmr IntoTheBlock), co-fondatore di @layerlens_ai, @faktoryai, @neuralfabric e The Sequence AI, insegnamento alla Columbia-Wharton

48989517 lug, 14:23

@SentoraHQ e @FlareNetworks Il progetto @Firelightfi ha raggiunto il secondo limite di registrazione dalla sua annuncio di lunedì. La comunità XRP è in fermento! Grazie per il supporto. Ora tutti a lavoro per il lancio tra poche settimane.

XRP-0,72%

27,21K

489895 ha ripubblicato

LayerLens14 lug, 21:24

🧠 Grok 4 di @xai sta facendo progressi nei benchmark di ragionamento, ma la situazione è più sfumata di quanto i punteggi suggeriscano. Ecco come si presenta — e cosa possiamo davvero imparare dai suoi risultati 🧵 📊 Valutazione completa: 1️⃣ Punteggi di Grok 4: • AI2 Reasoning Challenge (Facile): 98% • AIME 2025 (Matematica): 89% • Audit Contabile: 84% • MMLU-Plus: 64% • Data4Health: 55% Questi sono punteggi generali — ma concentriamoci su cosa funziona e cosa ancora fallisce. 2️⃣ AIME 2025 ✅ Gestisce algebra, geometria, teoria dei numeri ✅ Segue le regole di formattazione LaTeX ❌ Ha difficoltà con la logica a più passaggi ❌ Errori nella combinatoria ❌ Problemi di precisione nel formato (ad es. ° mancante) 3️⃣ Audit Contabile ✅ Forte in etica e reporting ✅ Buona comprensione dei principi di auditing ❌ Malinterpreta procedure simili ❌ Non riesce a individuare sottili differenze nelle risposte ❌ Difficoltà ad applicare la teoria a casi reali 4️⃣ La vera intuizione? Anche un modello con il 98% in alcuni compiti può fallire duramente sotto ambiguità o stress di formattazione. I benchmark come AIME e Audit mostrano come fallisce, non solo quanto segna. 5️⃣ Perché questo è importante: Abbiamo bisogno di una valutazione trasparente, per compito — non solo di classifiche. #Grok4 è potente, ma ancora fragile in domini reali ad alto rischio. 🧪 Esplora il riepilogo completo: #AI #LLMs #Benchmarking

1,05K

489895 ha ripubblicato

firelight8 lug, 00:58

7 giorni fino a quando la nostra lista d'attesa sarà ATTIVA! Sii tra i primi 1.000 a sbloccare i vantaggi per i primi adottanti, l'alpha e i premi di staking potenziati. 👉 Iscriviti il 14 luglio per lo staking liquido di grado istituzionale per $XRP.

110,36K

4898954 lug, 03:07

Ho cercato di delineare alcune idee uniche in questo: Trasformatori a Vetrina: Come i Circuiti Illuminano i Meccanismi Interni del Deep Learning,

169

4898952 lug, 20:34

Mi è piaciuto molto scrivere questo :) L'Ingegneria delle Sequenze #676: Hacking con Gemini CLI

203

489895 ha ripubblicato

Sentora (previously IntoTheBlock)2 lug, 00:15

La ricerca di Anthropic sull'"inference confidenziale" alimentata da TEE potrebbe rimodellare il Web3-AI. Il co-fondatore di Sentora @jrdothoughts spiega i dettagli qui👇

21,73K

489895 ha ripubblicato

Carlos Domingo1 lug, 22:41

Eccellente analisi sulla recente mania dei prodotti azionari tokenizzati, sono d'accordo che non siano buoni prodotti e spero che sia la prima iterazione di qualcosa di utile che arriverà in futuro, quando saranno sviluppati modelli migliori.

3,35K

4898951 lug, 20:10

La Conoscenza della Sequenza #675: Imparare a Valutare le IA Multi-Agente

4898951 lug, 19:46

La Conoscenza della Sequenza #675: Imparare a Valutare le IA Multi-Agente

221

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari