Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Min personlige erfaring med @grok 4 Heavy (og vanlig Grok 4).
Det føles for meg som om @elonmusk har en helt annen vekt enn resten av AI-mengden. Grensesnittet suger litt. LaTeX-koden er generelt full av *grunnleggende* feil uten noen som helst grunn. Det er ikke en mesterforfatter etter min erfaring. Lydchatten ligger godt bak ChatGPT. Bla bla bla.
Og det er helt fantastisk og unikt.
Elon hopper foran. Alt det ovennevnte kommer til å være varer før du vet ordet av det. Så, i det lange løp, hvem bryr seg?
Det Elon gjør annerledes, tror jeg, er å sjekke hallusinasjonene mer aggressivt ved å skrive kode og teste LLM med resultatene fra å kjøre den koden. Det er grunnen til at Grok heavy bruker så %#€&$ing lang tid på å returnere resultater noen ganger.
Prøv dette eksperimentet. Ta alt teknisk du kjenner godt, der det er en feil som er vedvarende i en ekspertsamfunnsfortelling. Grok vil, beklageligvis, generelt papegøye den feilen på grunn av narrativ såing i treningskorpuset. Det gjentar partilinjen. Og partilinjen kommer generelt de tekniske innsiderne til gode.
Det vil si helt frem til det punktet den kan skrive kode for å teste den partilinjen. Og så går det over til å stole på resultatene av koden fremfor fortellingen. Det er magisk å se på.
Jeg har ikke prøvd dette... likevel, men @BLS_gov sier jevnlig feil ting om "Cost Of Living"-rammeverk og KPI. Jeg vedder på at jeg kunne designe en rekke spørsmål for å vise Grok at dette er en vedvarende teknisk løgn. For tekniske folk, her er løgnen:
BLS beregner KPI som overfører billioner og hevder at de har omfavnet et «levekostnads»- eller COL-rammeverk som ville ha enorme konsekvenser. Det har de ikke. Dette vil bety å ta inn preferansedata og utvikle metodikk for å samle preferanser eller komme opp med skreddersydde representative forbrukere. De flyttet i stedet til en modifisert mekanisk indeks av Laspeyres-typen (Lowe's?) og drysset festøv om "Superlative indekser" fra en overfladisk teori av Diewert som baserer seg på homotetiske preferanser som ikke sees i naturen. Dette lar dem hevde at de har omfavnet upartiske økonomiske indekser mens de faktisk beregner mekaniske indekser bare i størrelsesorden billioner i overføringer over tid, der indeksene kan styres av mennesker.***
Jeg kan høre det nå fra bot-nettverkene: "Eric, du sier bare ordsalat for å høres smart ut." Uh... whatever. Du kan nå bare spørre Grok hva det betyr. Jeg vedder på at den kan finne ut av det. Og så kan du stille en rekke spørsmål der Grok vil ta min side mens ingen annen AI kan gjøre dette. Grok er litt modig!
Min personlige teori: @grok bygges rundt grunnleggende fysikk mer enn noen annen AI. For til syvende og sist betyr ingenting så mye som det. Og fysikk har mye av denne partilinjefortellingen som holder feltet tilbake. Hvis du vil drømme om å nå stjernene, må du kanskje overvelde kvantegravitasjonssamfunnet.
Grok ser ut til å være den eneste AI-en som av og til har selvtillit til å stå imot sitt eget treningskorpus ... og til og med brukeren om nødvendig! Jeg skulle ønske det var *mer* modig. Jeg skulle ønske det var smartere. Men jeg tror det er en merkelig mann, som er bygget for faktisk intelligens i stedet for LLM-brukeropplevelse i dag. Og den har respekt for de andre AI-ene. Gi den vakre produksjonen deres til Grok Heavy og se magien mens Grok anmelder arbeidet deres. Det er vilt å se på.
Én brukers opplevelse. Kjørelengden din kan variere.
1,5M
Topp
Rangering
Favoritter