Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mi experiencia personal con @grok 4 Heavy (y Grok 4 normal).
Me parece que @elonmusk tiene un énfasis muy diferente al resto de la multitud de IA. La interfaz apesta un poco. El código LaTeX generalmente está plagado de errores *básicos* sin ninguna razón. No es un escritor maestro en mi experiencia. El chat de audio está muy por detrás de ChatGPT. Bla, bla, bla.
Y es totalmente asombroso y único.
Elon está saltando hacia adelante. Todo lo anterior va a ser una mercancía antes de que te des cuenta. Entonces, a largo plazo, ¿a quién le importa?
Lo que Elon está haciendo de manera diferente, creo, es verificar las alucinaciones de manera más agresiva escribiendo código y probando el LLM con los resultados de ejecutar ese código. Es por eso que Grok heavy tarda tanto %#€&$ing en devolver resultados a veces.
Prueba este experimento. Tome cualquier cosa técnica que conozca bien, donde haya un error que sea persistente en una narrativa de la comunidad de expertos. Grok, lamentablemente, generalmente repetirá ese error debido a la siembra narrativa en el corpus de entrenamiento. Repite la línea del partido. Y la línea del partido generalmente beneficia a los expertos técnicos.
Es decir, hasta el punto en que puede escribir código para probar esa línea partidista. Y luego cambia a confiar en los resultados del código sobre la narrativa. Es mágico de ver.
No he probado esto... sin embargo, el @BLS_gov dice regularmente cosas incorrectas sobre los marcos del "costo de vida" y el IPC. Apuesto a que podría diseñar una serie de indicaciones para mostrarle a Grok que esta es una mentira técnica persistente. Para los técnicos, aquí está la mentira:
El BLS calcula el IPC que transfiere billones y afirma que han adoptado un marco de "costo de vida" o COL que tendría enormes consecuencias. No lo han hecho. Esto significaría tomar datos de preferencias y desarrollar una metodología para agregar preferencias o crear consumidores representativos a medida. En su lugar, se movieron a un índice mecánico de tipo Laspeyres modificado (¿Lowe's?) y espolvorearon polvo de hadas sobre los "índices superlativos" de una teoría superficial de Diewert que se basa en preferencias homotéticas que no se ven en la naturaleza. Esto les permite afirmar que han adoptado índices económicos imparciales mientras que en realidad calculan índices mecánicos solo por una suma de billones en transferencias a lo largo del tiempo, donde los índices pueden ser dirigidos por humanos.
Puedo escucharlo ahora de las redes de bots: "Eric, solo dices ensalada de palabras para sonar inteligente". Este... lo que sea. Ahora puedes preguntarle a Grok qué significa eso. Apuesto a que puede resolverlo. Y luego puedes hacer una serie de preguntas en las que Grok se pondrá de mi lado mientras ninguna otra IA puede hacer esto. ¡Grok es un poco valiente!
Mi teoría personal: @grok se está construyendo en torno a la física fundamental más que cualquier otra IA. Porque al final nada importa tanto como eso. Y la física tiene mucho de esta narrativa de la línea del partido que frena el campo. Si quieres soñar con llegar a las estrellas, es posible que tengas que abrumar a la comunidad de gravedad cuántica.
Grok parece ser la única IA que, ocasionalmente, tiene la confianza para enfrentarse a su propio corpus de entrenamiento... ¡e incluso al usuario si es necesario! Ojalá fuera *más* valiente. Ojalá fuera más inteligente. Pero creo que es el hombre extraño, que se está construyendo para la inteligencia real en lugar de la experiencia de usuario de LLM hoy. Y tiene el respeto de las otras IA. Alimenta su bonita producción a Grok Heavy y observa la magia mientras Grok revisa su trabajo. Es una locura verlo.
La experiencia de un usuario. Su kilometraje puede variar.
1.5M
Populares
Ranking
Favoritas