Глубоко согласен: 1. Многопользовательское параллельное сотрудничество менее стабильно, чем однопоточное; 2. RAG ненадежен, хуже традиционного поиска; 3. Чем больше команд в подсказках, тем менее модель понимает, что выбирать. —— Перевод оригинального твита —— На пути к созданию AI-агентов наша команда @Cline выявила три "вируса мышления". Под "вирусами мышления" понимаются заманчивые идеи, которые звучат очень умно, но на практике совершенно не работают. Эти три вируса: * Многопользовательское сотрудничество (Multi-Agent Orchestration) * Увеличение поиска (RAG) * Чем больше команд = тем лучше результат Давайте разберемся! 1. Многопользовательское сотрудничество Сцена из научно-фантастического фильма — "агенты поддержки, агенты снабжения, аналитические агенты, командные агенты" отправляют целую армию подагентов, а затем сводят результаты вместе — звучит действительно круто. Но на самом деле большинство полезной работы агентов выполняется в однопоточном режиме. Сложные процессы сотрудничества редко приносят реальную ценность, а скорее создают хаос. Имейте в виду, что просто заставить модель работать стабильно в однопоточном режиме уже достаточно сложно, не говоря уже о том, чтобы обрабатывать параллельную логику сотрудничества. Это не только увеличивает сложность реализации, но и делает процесс понимания и принятия решений модели необычайно сложным. 2. Использование RAG для создания агентов RAG, то есть Увеличение поиска (Retrieval Augmented Generation), также является вирусом мышления. На теоретическом уровне он выглядит очень мощным, но на практике, особенно в сценариях агентов, иногда даже базовая команда текстового поиска GREP оказывается более полезной. Почему ореол RAG тускнеет в реальных рабочих процессах агентов? Потому что информация, которую он находит, часто является разрозненными фрагментами, которые не позволяют модели сформировать связное и полезное "понимание". Лучший подход почти всегда заключается в том, чтобы позволить модели самой перечислить файлы, искать их аналогично grep, а затем открывать и читать весь файл (как это делает человек). Команда @Cline начала это делать довольно рано, и позже мы увидели, что @Amp — Research Preview и @Cursor также перешли к этому более практичному подходу. 3. Чем больше команд = тем лучше результат Существует широко распространенное заблуждение: если в системных подсказках (system prompt) накапливать все больше "команд", модель станет умнее. Это совершенно неверно. "Переполнение" подсказок только запутает модель, поскольку больше команд часто приводит к конфликту рекомендаций и избытку информации. В результате вам придется постоянно "латать" странные поведения модели, как в игре "Ударь крота", вместо того чтобы получать действительно полезные результаты. Для большинства современных передовых моделей лучший подход — не мешать им, а не кричать в стороне, пытаясь направить их в определенное направление. Цените каждое ваше слово (или, скажем, токен). В общем, все три идеи очень соблазнительны. Если вы не проводите весь день с AI, вы можете подумать, что они все очень разумны — однако это не так. Конечно, с улучшением возможностей базовых моделей наше мнение о этих методах может измениться в будущем.
Ara
Ara20 авг., 01:00
При создании AI-агентов @cline мы выявили три вируса мышления. Вирусы мышления — это соблазнительные идеи, которые звучат умно, но не работают на практике. 1. Оркестрация многопользовательских агентов 2. RAG (Увеличенная генерация с использованием извлечения) 3. Больше инструкций = лучшие результаты Давайте разберемся, почему!
85,85K