RIP FLAT RAG ☠️ ByteDance právě otevřel OpenViking a odhaluje všechno špatně v tom, jak jsme budovali paměť AI agentů. Tady je, co každý agent framework dělá špatně: Vzpomínky žijí na jednom místě. Zdroje v jiném. Dovednosti roztroušené všude. A když potřebujete kontext, děláte ploché vektorové vyhledávání a doufáte v nejlepší. To je ten problém. OpenViking to všechno řeší jedním nápadem: zacházet s kontextem agenta jako se souborovým systémem. Vše žije podle jednotného viking:// protokolu. Vzpomínky, zdroje, dovednosti – vše uspořádané v adresářích s unikátními URI. Agenti mohou LS, najít a orientovat se v kontextu jako vývojář pracující s terminálem. Ale skutečným průlomem je stupňovité načítání: → L0: jednovětný abstrakt pro rychlé vyhledávání → L1: ~2k přehled tokenů pro plánovací rozhodnutí → L2: úplné detaily se načítají jen tehdy, když je skutečně potřeba Většina agentů vše přenáší do kontextu a modlí se. OpenViking načítá jen to, co je potřeba, když je to potřeba. Ceny tokenů klesají. Přesnost roste. A odebírání teď dává smysl. Místo jednoho plochého sémantického vyhledávání nejprve provádí pozice na úrovni adresářů a poté rekurzivní zpřesňování uvnitř adresářů s vysokým skóre. Doslova můžete sledovat trajektorii vyhledávání, žádná další černá skříňka. Část o sebe-evoluci je taky divoká. Na konci každé relace automaticky extrahuje poznatky a aktualizuje paměť agenta i uživatele. Agent je čím dál chytřejší, čím víc ho využíváte. 9 tisíc hvězd. 13 přispěvatelů. Postaveno týmem ByteDance Viking, který provozuje vektorovou infrastrukturu od roku 2019. 100% opensource. Apache 2.0. Odkaz v komentářích.