Moje osobiste doświadczenie z @grok 4 Heavy (i zwykłym Grok 4). Wydaje mi się, że @elonmusk ma zupełnie inne akcenty niż reszta społeczności AI. Interfejs jest do niczego. Kod LaTeX jest zazwyczaj pełen *podstawowych* błędów bez żadnego powodu. To nie jest mistrz pisania w moim doświadczeniu. Czat audio jest znacznie gorszy od ChatGPT. Bla bla bla. I to jest całkowicie niesamowite i unikalne. Elon wyprzedza innych. Wszystko powyższe stanie się towarami, zanim się obejrzysz. Więc, na dłuższą metę, kogo to obchodzi? To, co Elon robi inaczej, moim zdaniem, to bardziej agresywne sprawdzanie halucynacji poprzez pisanie kodu i testowanie LLM na podstawie wyników z uruchamiania tego kodu. Dlatego Grok heavy czasami tak %#€&$ długo zwraca wyniki. Spróbuj tego eksperymentu. Weź cokolwiek technicznego, co dobrze znasz, gdzie istnieje błąd, który jest uporczywy w narracji społeczności ekspertów. Grok, niestety, zazwyczaj powtarza ten błąd z powodu zasiewania narracji w zbiorze treningowym. Powtarza linię partii. A linia partii zazwyczaj korzysta z technicznych insiderów. To znaczy, aż do momentu, gdy może napisać kod, aby przetestować tę linię partii. A wtedy zaczyna ufać wynikom kodu ponad narracją. To magiczne, aby to obserwować. Nie próbowałem tego… jeszcze, ale @BLS_gov regularnie mówi błędne rzeczy na temat ram „Kosztu życia” i CPI. Zakładam, że mógłbym zaprojektować serię podpowiedzi, aby pokazać Grokowi, że to jest uporczywe techniczne kłamstwo. Dla technicznych ludzi, oto kłamstwo: ***BLS oblicza CPI, który transferuje tryliony i twierdzi, że przyjęli ramy „kosztu życia” lub COL, co miałoby ogromne konsekwencje. Nie zrobili tego. Oznaczałoby to uwzględnienie danych preferencyjnych i opracowanie metodologii agregowania preferencji lub stworzenie reprezentatywnych konsumentów. Zamiast tego przeszli na zmodyfikowany indeks mechaniczny typu Laspeyres (Lowe’a?) i posypali wróżkowym pyłem o „Indeksach Superlatywnych” z płytkiej teorii Diewerta, która opiera się na preferencjach homotetycznych, które nie występują w naturze. To pozwala im twierdzić, że przyjęli bezstronne wskaźniki ekonomiczne, podczas gdy w rzeczywistości obliczają tylko mechaniczne wskaźniki na kwotę trylionów transferów w czasie, gdzie wskaźniki mogą być kierowane przez ludzi.*** Słyszę to teraz z sieci botów: „Eric, po prostu mówisz sałatkę słowną, żeby brzmieć mądrze.” Uh… cokolwiek. Możesz teraz po prostu zapytać Groka, co to znaczy. Zakładam, że może to zrozumieć. A potem możesz zadać serię pytań, w których Grok weźmie moją stronę, podczas gdy żaden inny AI nie może tego zrobić. Grok jest trochę odważny! Moja osobista teoria: @grok jest budowany wokół fundamentalnej fizyki bardziej niż jakikolwiek inny AI. Bo w końcu nic nie ma takiego znaczenia jak to. A fizyka ma wiele tej narracji linii partii, która powstrzymuje dziedzinę. Jeśli chcesz marzyć o dotarciu do gwiazd, być może będziesz musiał przytłoczyć społeczność grawitacji kwantowej. Grok wydaje się być jedynym AI, który, od czasu do czasu, ma pewność, aby stanąć przeciwko własnemu zbiorowi treningowemu… a nawet użytkownikowi, jeśli zajdzie taka potrzeba! Chciałbym, żeby był *bardziej* odważny. Chciałbym, żeby był mądrzejszy. Ale myślę, że jest dziwnym przypadkiem, budowanym dla rzeczywistej inteligencji, a nie dla doświadczenia użytkownika LLM dzisiaj. I ma szacunek innych AI. Podawaj ich ładne wyniki do Grok Heavy i obserwuj magię, gdy Grok przegląda ich pracę. To dzikie do obserwowania. Doświadczenie jednego użytkownika. Twoje doświadczenie może się różnić.
1,5M