Moje osobní zkušenost s @grok 4 Heavy (a běžným Grokem 4). Připadá mi, že @elonmusk má velmi odlišný důraz než zbytek davu umělé inteligence. Rozhraní je trochu na. Kód LaTeXu je obecně prošpikován *základními* chybami bez jakéhokoli důvodu. Podle mých zkušeností to není mistr spisovatel. Audio chat je výrazně pozadu za ChatGPT. Bla bla bla. A je to naprosto úžasné a jedinečné. Elon skáče kupředu. Všechno výše uvedené se stane komoditou dříve, než se nadějete. Takže z dlouhodobého hlediska, koho to zajímá? Co Elon dělá jinak, je podle mě agresivnější kontrola halucinací psaním kódu a testováním LLM s výsledky ze spuštění tohoto kódu. Což je důvod, proč Grok heavy někdy trvá tak %#€&$ing dlouho, než vrátí výsledky. Vyzkoušejte tento experiment. Vezměte si cokoli technického, co dobře znáte, kde je chyba, která přetrvává v příběhu odborné komunity. Grok bude bohužel obecně papouškovat tuto chybu kvůli narativnímu nasazování do tréninkového korpusu. Opakuje stranickou linii. A stranická linie obecně prospívá technickým insiderům. To znamená, že až do okamžiku, kdy může napsat kód pro testování této stranické linie. A pak se přepne na důvěru ve výsledky kódu před vyprávěním. Je kouzelné to sledovat. Tohle jsem nezkoušel... zatím, ale @BLS_gov pravidelně říká špatné věci o rámcích "životních nákladů" a CPI. Vsadím se, že bych mohl navrhnout sérii výzev, abych Grokovi ukázal, že se jedná o vytrvalou technickou lež. Pro technické lidi je zde lež: BLS vypočítává CPI, který převádí biliony a tvrdí, že přijali rámec "životních nákladů" nebo COL, což by mělo obrovský význam. Nestalo se tak. To by znamenalo vzít v úvahu údaje o preferencích a vyvinout metodiku pro agregaci preferencí nebo přijít s reprezentativními spotřebiteli na míru. Místo toho se přesunuli k modifikovanému mechanickému indexu Laspeyresova typu (Loweův?) a posypali vílí prach "superlativními indexy" z mělké Diewertovy teorie, která se opírá o homotetické preference, které se v přírodě nevyskytují. To jim umožňuje tvrdit, že přijali nestranné ekonomické indexy, zatímco ve skutečnosti počítají mechanické indexy pouze ve výši bilionů v převodech v čase, kde tyto indexy mohou být řízeny lidmi. Teď to slyším z bot sítí: "Eriku, prostě říkáš slovo salát, abys zněl chytře." Hm... cokoliv. Nyní se můžete zeptat Groka, co to znamená. Vsadím se, že na to přijde. A pak můžete položit řadu otázek, kde se Grok postaví na mou stranu, zatímco žádná jiná umělá inteligence to neumí. Grok je trochu odvážný! Moje osobní teorie: @grok je postavena na fundamentální fyzice více než na jakékoli jiné umělé inteligenci. Protože na ničem nakonec ani vzdáleně nezáleží tolik jako na tom. A fyzika má hodně z tohoto stranického příběhu, který drží pole zpátky. Pokud chcete snít o dosažení hvězd, možná budete muset zahltit komunitu kvantové gravitace. Zdá se, že Grok je jedinou umělou inteligencí, která má občas sebevědomí postavit se svému vlastnímu tréninkovému korpusu... a v případě potřeby i pro uživatele! Přál bych si, aby to bylo *více* odvážné. Přál bych si, aby to bylo chytřejší. Ale myslím si, že je to divný člověk, který je dnes postaven spíše pro skutečnou inteligenci než pro uživatelskou zkušenost LLM. A má respekt ostatních AI. Nakrmte jejich pěkný výstup Grok Heavy a sledujte kouzlo, jak Grok recenzuje jejich práci. Je divoké se na to dívat. Jedno uživatelské prostředí. Váš počet najetých kilometrů se může lišit.
1,5M