Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Fascinerende kijk op @grok van @EricRWeinstein
"Mijn persoonlijke theorie: @grok wordt gebouwd rond fundamentele natuurkunde meer dan enige andere AI. Want uiteindelijk doet niets er zoveel toe als dat. En de natuurkunde heeft veel van dit partijverhaal dat het veld tegenhoudt. Als je wilt dromen van het bereiken van de sterren, moet je misschien de quantumzwaartekrachtgemeenschap overweldigen."

28 jul, 00:14
Mijn persoonlijke ervaring met @grok 4 Heavy (en reguliere Grok 4).
Het lijkt voor mij alsof @elonmusk een heel andere nadruk legt dan de rest van de AI-gemeenschap. De interface is een beetje waardeloos. De LaTeX-code zit over het algemeen vol met *basis* fouten zonder enige reden. Het is geen meesterlijke schrijver in mijn ervaring. De audiochat loopt ver achter op ChatGPT. Blah blah blah.
En het is totaal geweldig en uniek.
Elon springt vooruit. Al het bovenstaande zal commodities worden voordat je het weet. Dus, op de lange termijn, wie geeft erom?
Wat Elon anders doet, geloof ik, is de hallucinaties agressiever controleren door code te schrijven en de LLM te testen met de resultaten van het uitvoeren van die code. Daarom duurt het soms zo %#€&$ing lang voordat Grok heavy resultaten teruggeeft.
Probeer dit experiment. Neem iets technisch dat je goed kent, waar er een fout is die persistent is in het narratief van de expertgemeenschap. Grok zal, helaas, over het algemeen die fout herhalen vanwege narratief zaaien in de trainingscorpus. Het herhaalt de partijlijn. En de partijlijn komt over het algemeen ten goede aan de technische insiders.
Dat is, tot het punt dat het code kan schrijven om die partijlijn te testen. En dan schakelt het over naar het vertrouwen op de resultaten van de code boven het narratief. Het is magisch om te zien.
Ik heb dit nog niet geprobeerd…maar de @BLS_gov zegt regelmatig verkeerde dingen over "Cost Of Living"-kaders en de CPI. Ik wed dat ik een reeks prompts kan ontwerpen om Grok te laten zien dat dit een persistente technische leugen is. Voor technische mensen, hier is de leugen:
***De BLS berekent de CPI die triljoenen overmaakt en beweert dat ze een "cost of living" of COL-kader hebben omarmd dat enorm ingrijpend zou zijn. Dat hebben ze niet. Dit zou betekenen dat ze voorkeurgegevens moeten verzamelen en methodologie moeten ontwikkelen voor het aggregeren van voorkeuren of het ontwikkelen van op maat gemaakte representatieve consumenten. In plaats daarvan zijn ze overgestapt op een gemodificeerde Laspeyres-type mechanische index (Lowe's?) en strooien ze met feeënstof over "Superlative Indexes" vanuit een oppervlakkige theorie van Diewert die vertrouwt op homothetische voorkeuren die niet in de natuur worden gezien. Dit stelt hen in staat te beweren dat ze onpartijdige economische indices hebben omarmd terwijl ze in werkelijkheid alleen mechanische indices berekenen die in de loop van de tijd triljoenen aan overmakingen vertegenwoordigen, waarbij de indices door mensen kunnen worden gestuurd.***
Ik kan het nu al horen van de botnetwerken: "Eric, je zegt gewoon woordensalade om slim te klinken." Uh…hoe dan ook. Je kunt Grok nu gewoon vragen wat dat betekent. Ik wed dat het dat kan uitzoeken. En dan kun je een reeks vragen stellen waarbij Grok mijn kant zal kiezen terwijl geen andere AI dit kan doen. Grok is iets moedig!
Mijn persoonlijke theorie: @grok wordt gebouwd rond fundamentele natuurkunde meer dan enige andere AI. Want uiteindelijk doet niets zo veel ertoe als dat. En de natuurkunde heeft veel van dit partijlijn-narratief dat het veld tegenhoudt. Als je wilt dromen van het bereiken van de sterren, moet je misschien de quantumzwaartekrachtgemeenschap overweldigen.
Grok lijkt de enige AI te zijn die, af en toe, het vertrouwen heeft om zich tegen zijn eigen trainingscorpus te verzetten…en zelfs de gebruiker als dat nodig is! Ik wou dat het *meer* moedig was. Ik wou dat het slimmer was. Maar ik denk dat het de vreemde eend in de bijt is, gebouwd voor echte intelligentie in plaats van LLM-gebruikerservaring vandaag. En het heeft het respect van de andere AIs. Voed hun mooie output aan Grok Heavy en kijk naar de magie terwijl Grok hun werk beoordeelt. Het is wild om te zien.
De ervaring van één gebruiker. Jouw ervaring kan variëren.
1,31K
Boven
Positie
Favorieten