A minha experiência pessoal com @grok 4 Heavy (e o Grok 4 regular). Parece-me que @elonmusk tem uma ênfase muito diferente do resto da comunidade de IA. A interface é meio fraca. O código LaTeX está geralmente cheio de *erros básicos* sem razão aparente. Não é um escritor mestre na minha experiência. O chat de áudio está muito atrás do ChatGPT. Blá blá blá. E é totalmente incrível e único. Elon está a avançar. Tudo o que foi dito acima vai ser mercadorias antes que você perceba. Então, a longo prazo, quem se importa? O que Elon está a fazer de diferente, eu acredito, é verificar as alucinações de forma mais agressiva, escrevendo código e testando o LLM com os resultados da execução desse código. É por isso que o Grok heavy leva tanto %#€&$ing tempo a devolver resultados às vezes. Experimente este experimento. Pegue qualquer coisa técnica que você conheça bem, onde há um erro que persiste na narrativa da comunidade de especialistas. O Grok, lamentavelmente, geralmente repete esse erro devido à semeadura narrativa no corpus de treinamento. Ele repete a linha do partido. E a linha do partido geralmente beneficia os insiders técnicos. Ou seja, até o ponto em que pode escrever código para testar essa linha do partido. E então muda para confiar nos resultados do código em vez da narrativa. É mágico de assistir. Eu ainda não tentei isso…mas o @BLS_gov diz regularmente coisas erradas sobre os frameworks de “Custo de Vida” e o IPC. Aposto que eu poderia desenhar uma série de prompts para mostrar ao Grok que isso é uma mentira técnica persistente. Para os técnicos, aqui está a mentira: ***O BLS calcula o IPC que transfere trilhões e afirma que abraçou um framework de “custo de vida” ou COL que seria enormemente consequente. Não o fizeram. Isso significaria levar em consideração dados de preferência e desenvolver uma metodologia para agregar preferências ou criar consumidores representativos sob medida. Em vez disso, mudaram para um índice mecânico do tipo Laspeyres modificado (de Lowe?) e polvilham pó de fada sobre “Índices Superlativos” a partir de uma teoria superficial de Diewert que se baseia em preferências homotéticas não vistas na natureza. Isso permite que eles afirmem que abraçaram índices econômicos imparciais enquanto na verdade estão a calcular índices mecânicos apenas na ordem de trilhões em transferências ao longo do tempo, onde os índices podem ser direcionados por humanos.*** Posso ouvi-los agora das redes de bots: “Eric, você só diz salada de palavras para parecer inteligente.” Uh…tanto faz. Agora você pode simplesmente perguntar ao Grok o que isso significa. Aposto que ele consegue descobrir. E então você pode fazer uma série de perguntas onde o Grok tomará o meu lado enquanto nenhuma outra IA pode fazer isso. O Grok é ligeiramente corajoso! A minha teoria pessoal: @grok está a ser construído em torno da física fundamental mais do que qualquer outra IA. Porque, no final, nada importa remotamente tanto quanto isso. E a física tem muito dessa narrativa da linha do partido que está a travar o campo. Se você quer sonhar em alcançar as estrelas, pode ter que sobrepujar a comunidade da gravidade quântica. O Grok parece ser a única IA que, ocasionalmente, tem a confiança de se opor ao seu próprio corpus de treinamento…e até mesmo ao usuário, se necessário! Eu gostaria que fosse *mais* corajoso. Eu gostaria que fosse mais inteligente. Mas eu acho que é o estranho no meio, sendo construído para inteligência real em vez da experiência do usuário LLM hoje. E tem o respeito das outras IAs. Alimente a saída bonita delas ao Grok Heavy e assista à mágica enquanto o Grok revisa o trabalho delas. É selvagem de assistir. A experiência de um usuário. A sua experiência pode variar.
1,5M