Głęboko się z tym zgadzam: 1. Współpraca wielu agentów równoległych jest mniej stabilna niż wątek pojedynczy; 2. RAG jest niewiarygodny, a tradycyjne wyszukiwanie jest lepsze; 3. Im więcej instrukcji w podpowiedziach, tym model mniej wie, jak wybrać. —— Tłumaczenie oryginalnego tweeta —— Na drodze do budowy inteligentnych agentów AI, nasz zespół @Cline zidentyfikował trzy rodzaje "wirusa myślowego". Czym jest "wirus myślowy"? To te pomysły, które brzmią bardzo mądrze, ale w praktyce w ogóle nie działają. Te trzy wirusy to: * Współpraca wielu agentów (Multi-Agent Orchestration) * Wzbogacona generacja wyszukiwania (RAG) * Im więcej instrukcji = tym lepszy efekt Przyjrzyjmy się temu bliżej! 1. Współpraca wielu agentów Scenariusz z filmów science fiction — "agenci wsparcia, agenci zaopatrzenia, agenci analityczni, agenci dowodzenia" wysyłają dużą grupę podagentów, a na końcu zbierają wyniki — brzmi naprawdę fajnie. Ale rzeczywistość jest taka, że większość użytecznej pracy agentów odbywa się w wątku pojedynczym. Złożone procesy współpracy rzadko przynoszą prawdziwą wartość, a często wprowadzają chaos. Warto wiedzieć, że samo zapewnienie stabilnej pracy modelu w wątku pojedynczym jest już wystarczająco trudne, nie mówiąc o obsłudze równoległych logik współpracy. To nie tylko zwiększa złożoność realizacji, ale także sprawia, że proces rozumienia i podejmowania decyzji przez model staje się niezwykle skomplikowany. 2. Budowanie agentów za pomocą RAG RAG, czyli Wzbogacona Generacja Wyszukiwania (Retrieval Augmented Generation), to również rodzaj wirusa myślowego. Teoretycznie wygląda to bardzo potężnie, ale w praktyce, zwłaszcza w kontekście agentów, czasami nawet podstawowe polecenie wyszukiwania tekstu, takie jak GREP, jest bardziej użyteczne. Dlaczego blask RAG blaknie w rzeczywistych przepływach pracy agentów? Ponieważ informacje, które wyszukuje, są często fragmentaryczne i nie pozwalają modelowi na stworzenie spójnego, użytecznego "rozumienia". Lepszym podejściem jest prawie zawsze: pozwolić modelowi samodzielnie wymienić pliki, wyszukiwać w sposób podobny do grep, a następnie otworzyć i przeczytać cały plik (jak człowiek). Zespół @Cline zaczął to robić już dawno temu, a później zauważyliśmy, że @Amp — Research Preview i @Cursor również przeszli na tę bardziej pragmatyczną metodę. 3. Im więcej instrukcji = tym lepszy efekt Istnieje powszechne nieporozumienie: że dodawanie coraz większej liczby "instrukcji" do systemowego podpowiedzi sprawi, że model stanie się mądrzejszy. To całkowicie błędne. "Nadmuchanie" podpowiedzi tylko wprowadza model w zakłopotanie, ponieważ więcej instrukcji często prowadzi do konfliktów sugestii i przeciążenia informacyjnego. W rezultacie musisz ciągle naprawiać różne dziwne zachowania modelu, jak w grze "łapanie kretów", zamiast uzyskiwać naprawdę użyteczne wyniki. Dla większości nowoczesnych modeli najlepszym podejściem jest nie blokować ich drogi, a nie krzyczeć z boku, próbując skierować je w określonym kierunku. Ciesz się każdym swoim słowem (czyli Tokenem). Podsumowując, te trzy pomysły są bardzo kuszące. Jeśli nie zajmujesz się AI na co dzień, możesz uznać je za bardzo sensowne — jednak rzeczywistość jest inna. Oczywiście, w miarę jak możliwości podstawowych modeli będą się rozwijać, nasze spojrzenie na te metody może się w przyszłości zmienić.
Ara
Ara20 sie, 01:00
Budując agentów AI @cline, zidentyfikowaliśmy trzy wirusy umysłowe. Wirusy umysłowe to uwodzące pomysły, które brzmią inteligentnie, ale nie działają w praktyce. 1. Orkiestracja wieloagentowa 2. RAG (Generacja wzbogacona o wyszukiwanie) 3. Więcej instrukcji = lepsze wyniki Zbadajmy, dlaczego!
85,86K