Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-1,84%

Boopa+1,13%

PORK-14,84%

489895

Cofundador, CTO-CPO da @SentoraHQ (fmr IntoTheBlock), cofundador da @layerlens_ai, @faktoryai, @neuralfabric e The Sequence AI, Teaching na Columbia-Wharton

48989517/07, 14:23

@SentoraHQ e @FlareNetworks O projeto @Firelightfi atingiu o segundo limite de registro desde o seu anúncio na segunda-feira. A comunidade XRP está em chamas! Obrigado pelo apoio. Agora, todos a bordo para o lançamento em algumas semanas.

XRP-2,67%

27,2K

489895 republicou

LayerLens14/07, 21:24

🧠 Grok 4 da @xai está a fazer progressos em benchmarks de raciocínio, mas a situação é mais complexa do que os resultados sugerem. Aqui está como se compara — e o que realmente podemos aprender com os seus resultados 🧵 📊 Avaliação completa: 1️⃣ Pontuações do Grok 4: • Desafio de Raciocínio AI2 (Fácil): 98% • AIME 2025 (Matemática): 89% • Auditoria Contábil: 84% • MMLU-Plus: 64% • Data4Health: 55% Estas são pontuações gerais — mas vamos analisar o que está a funcionar e o que ainda falha. 2️⃣ AIME 2025 ✅ Lida bem com álgebra, geometria, teoria dos números ✅ Segue as regras de formatação LaTeX ❌ Tem dificuldades com lógica de múltiplos passos ❌ Erros em combinatória ❌ Problemas de precisão de formato (por exemplo, falta de °) 3️⃣ Auditoria Contábil ✅ Forte em ética e relatórios ✅ Boa compreensão dos princípios de auditoria ❌ Interpreta mal procedimentos semelhantes ❌ Falha em identificar diferenças subtis nas respostas ❌ Dificuldade em aplicar teoria a casos do mundo real 4️⃣ A verdadeira percepção? Mesmo um modelo com 98% em algumas tarefas pode falhar gravemente sob ambiguidade ou pressão de formatação. Benchmarks como AIME e Auditoria mostram como ele falha, não apenas quanto pontua. 5️⃣ Por que isso é importante: Precisamos de uma avaliação transparente, por tarefa — não apenas tabelas de classificação. #Grok4 é poderoso, mas ainda frágil em domínios do mundo real de alto risco. 🧪 Explore a análise completa: #AI #LLMs #Benchmarking

1,04K

489895 republicou

firelight8/07, 00:58

Faltam 7 dias até a nossa lista de espera ficar ATIVA! Seja um dos primeiros 1.000 a desbloquear benefícios de early adopter, alpha e recompensas de staking aumentadas. 👉 Inscreva-se a 14 de julho para staking líquido de grau institucional para $XRP.

110,35K

4898954/07, 03:07

Tentei delinear algumas ideias únicas neste: Transformadores de Caixa de Vidro: Como os Circuitos Iluminam os Funcionamentos Internos do Aprendizado Profundo,

156

4898952/07, 20:34

Eu realmente gostei de escrever este :) A Engenharia de Sequência #676: Hackeando com Gemini CLI

189

489895 republicou

Sentora (previously IntoTheBlock)2/07, 00:15

A pesquisa da Anthropic sobre a "inferência confidencial" alimentada por TEE pode remodelar o Web3-AI. O co-fundador da Sentora, @jrdothoughts, explica os detalhes aqui👇

21,73K

489895 republicou

Carlos Domingo1/07, 22:41

Excelente análise sobre a recente mania dos produtos de ações tokenizadas, concordo que estes não são bons produtos e, espero, a primeira iteração de algo útil que virá no futuro, quando modelos melhores forem desenvolvidos.

3,35K

4898951/07, 20:10

O Conhecimento da Sequência #675: Aprendendo a Avaliar AIs Multi-Agente

4898951/07, 19:46

O Conhecimento da Sequência #675: Aprendendo a Avaliar AIs Multi-Agente

209

Top

Classificação

Favoritos

Tendências on-chain

Popular no X

Principais financiamentos atuais

Mais notável