Experiența mea personală cu @grok 4 Heavy (și Grok 4 obișnuit). Mi se pare că @elonmusk are un accent foarte diferit față de restul mulțimii AI. Interfața este cam nasolă. Codul LaTeX este în general plin de erori *de bază* fără niciun motiv. Nu este un scriitor maestru din experiența mea. Chat-ul audio este cu mult în urma ChatGPT. Bla bla bla. Și este absolut uimitor și unic. Elon sare înainte. Toate cele de mai sus vor fi mărfuri înainte de a-ți da seama. Deci, pe termen lung, cui îi pasă? Ceea ce Elon face diferit, cred, este verificarea halucinațiilor mai agresiv prin scrierea codului și testarea LLM cu rezultatele rulării acelui cod. De aceea Grok greu are nevoie de atât de mult %#€&$ing timp pentru a da rezultate uneori. Încercați acest experiment. Luați orice tehnic pe care îl cunoașteți bine, unde există o eroare care este persistentă într-o narațiune a comunității de experți. Grok, în mod lamentabil, va repeta papagalic această eroare din cauza însămânțării narative în corpusul de antrenament. Repetă linia partidului. Iar linia partidului avantajează în general cei din interiorul tehnic. Adică, până în momentul în care poate scrie cod pentru a testa acea linie de partid. Și apoi trece la încrederea în rezultatele codului în detrimentul narațiunii. Este magic de urmărit. Nu am încercat asta... totuși, dar @BLS_gov spune în mod regulat lucruri greșite despre cadrele "costului vieții" și CPI. Pun pariu că aș putea proiecta o serie de solicitări pentru a-i arăta lui Grok că aceasta este o minciună tehnică persistentă. Pentru oamenii tehnici, iată minciuna: BLS calculează IPC care transferă trilioane și susține că au îmbrățișat un cadru de "cost al vieții" sau COL care ar avea consecințe enorme. Nu au făcut-o. Acest lucru ar însemna luarea de date privind preferințele și dezvoltarea metodologiei pentru agregarea preferințelor sau pentru a veni cu consumatori reprezentativi pe măsură. În schimb, au trecut la un indice mecanic de tip Laspeyres modificat (Lowe's?) și au presărat praf de zână despre "indicii superlativi" dintr-o teorie superficială a lui Diewert care se bazează pe preferințe homotetice care nu sunt văzute în natură. Acest lucru le permite să pretindă că au îmbrățișat indici economici imparțiali, în timp ce de fapt calculează indici mecanici doar în valoare de trilioane de transferuri în timp, unde indicii pot fi direcționați de oameni. Pot auzi acum de la rețelele de roboți: "Eric, spui doar salată de cuvinte ca să sune inteligent." Uh... Orice. Acum îl puteți întreba pe Grok ce înseamnă asta. Pun pariu că își poate da seama de asta. Și apoi poți pune o serie de întrebări în care Grok va fi de partea mea, în timp ce nicio altă inteligență artificială nu poate face asta. Grok este ușor curajos! Teoria mea personală: @grok este construită în jurul fizicii fundamentale mai mult decât orice altă inteligență artificială. Pentru că, în cele din urmă, nimic nu contează atât de mult ca atât. Iar fizica are o mare parte din această narațiune de partid care ține terenul înapoi. Dacă vrei să visezi că ajungi la stele, s-ar putea să trebuiască să copleșești comunitatea gravitației cuantice. Grok pare a fi singura inteligență artificială care, ocazional, are încrederea de a-și opune propriul corpus de antrenament... și chiar utilizatorul dacă este necesar! Mi-aș dori să fie *mai curajos. Mi-aș dori să fie mai inteligent. Dar cred că este un om ciudat, fiind construit pentru inteligența reală, mai degrabă decât pentru experiența utilizatorului LLM astăzi. Și are respectul celorlalte AI. Hrănește-le producția frumoasă la Grok Heavy și urmărește magia în timp ce Grok le revizuiește munca. Este sălbatic de urmărit. Experiența unui utilizator. Kilometrajul tău poate varia.
1,5M