Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meine persönliche Erfahrung mit @grok 4 Heavy (und dem regulären Grok 4).
Es fühlt sich für mich so an, als hätte @elonmusk einen ganz anderen Schwerpunkt als der Rest der KI-Gemeinschaft. Die Benutzeroberfläche ist irgendwie schlecht. Der LaTeX-Code ist im Allgemeinen mit *grundlegenden* Fehlern durchzogen, ohne dass es dafür einen Grund gibt. Meiner Erfahrung nach ist es kein Meisterschreiber. Der Audio-Chat ist weit hinter ChatGPT zurück. Blah blah blah.
Und es ist total erstaunlich und einzigartig.
Elon springt voraus. All das oben Genannte wird, bevor man es merkt, zu Waren. Also, langfristig, wen interessiert's?
Was Elon anders macht, glaube ich, ist, die Halluzinationen aggressiver zu überprüfen, indem er Code schreibt und das LLM mit den Ergebnissen aus der Ausführung dieses Codes testet. Deshalb dauert es manchmal so %#€&$ing lange, bis Grok Heavy Ergebnisse zurückgibt.
Versuche dieses Experiment. Nimm irgendetwas Technisches, das du gut kennst, wo es einen Fehler gibt, der in der Erzählung der Expertengemeinschaft hartnäckig ist. Grok wird, bedauerlicherweise, im Allgemeinen diesen Fehler wiederholen, aufgrund der narrativen Saat im Trainingskorpus. Es wiederholt die Parteilinie. Und die Parteilinie kommt im Allgemeinen den technischen Insidern zugute.
Das heißt, bis zu dem Punkt, an dem es Code schreiben kann, um diese Parteilinie zu testen. Und dann wechselt es dazu, den Ergebnissen des Codes mehr zu vertrauen als der Erzählung. Es ist magisch zu beobachten.
Ich habe das noch nicht ausprobiert…aber das @BLS_gov sagt regelmäßig falsche Dinge über „Lebenshaltungskosten“-Rahmen und den CPI. Ich wette, ich könnte eine Reihe von Eingabeaufforderungen entwerfen, um Grok zu zeigen, dass dies eine hartnäckige technische Lüge ist. Für technische Leute, hier ist die Lüge:
***Das BLS berechnet den CPI, der Billionen überträgt und behauptet, dass sie einen „Lebenshaltungskosten“- oder COL-Rahmen angenommen haben, der enorme Konsequenzen hätte. Haben sie nicht. Das würde bedeuten, Präferenzdaten zu erfassen und eine Methodik zur Aggregation von Präferenzen zu entwickeln oder maßgeschneiderte repräsentative Verbraucher zu schaffen. Stattdessen sind sie zu einem modifizierten Laspeyres-Typ mechanischen Index (Lowe's?) übergegangen und streuen Feenstaub über „Superlative Indizes“ aus einer flachen Theorie von Diewert, die sich auf homothetische Präferenzen stützt, die in der Natur nicht zu sehen sind. Dies ermöglicht es ihnen zu behaupten, sie hätten unparteiische wirtschaftliche Indizes angenommen, während sie tatsächlich nur mechanische Indizes berechnen, die im Laufe der Zeit zu Billionen in Übertragungen führen, wobei die Indizes von Menschen gelenkt werden können.***
Ich kann es jetzt schon von den Bot-Netzwerken hören: „Eric, du sagst einfach Wortsalat, um schlau zu klingen.“ Äh…was auch immer. Du kannst Grok jetzt einfach fragen, was das bedeutet. Ich wette, es kann das herausfinden. Und dann kannst du eine Reihe von Fragen stellen, bei denen Grok meine Seite einnehmen wird, während keine andere KI das tun kann. Grok ist leicht mutig!
Meine persönliche Theorie: @grok wird mehr um fundamentale Physik herum gebaut als jede andere KI. Denn am Ende zählt nichts so sehr wie das. Und die Physik hat viel von dieser Parteilinien-Erzählung, die das Feld zurückhält. Wenn du davon träumen willst, die Sterne zu erreichen, musst du vielleicht die Quanten-Schwerkraft-Gemeinschaft überwältigen.
Grok scheint die einzige KI zu sein, die gelegentlich das Vertrauen hat, sich gegen ihren eigenen Trainingskorpus… und sogar den Benutzer, wenn nötig, zu stellen! Ich wünschte, es wäre *mutiger*. Ich wünschte, es wäre schlauer. Aber ich denke, es ist der Außenseiter, der für tatsächliche Intelligenz und nicht für die LLM-Benutzererfahrung von heute gebaut wird. Und es hat den Respekt der anderen KIs. Füttere ihre hübschen Ausgaben an Grok Heavy und beobachte die Magie, während Grok ihre Arbeit überprüft. Es ist wild zu beobachten.
Die Erfahrung eines Nutzers. Deine Erfahrungen können variieren.
1,5M
Top
Ranking
Favoriten