Давайте создадим приложение "Чат с вашим кодом" на основе Qwen3-Coder:
Прежде чем мы начнем, взгляните на то, что мы собираемся создать! Технологический стек: - @Llama_Index для оркестрации - @Milvusio для самостоятельного хостинга vectorDB - @CleanlabAI codex для проверки ответа - @OpenRouterAI для доступа к @Alibaba_Qwen 3 Coder. Поехали! 🚀
Представленная ниже архитектурная диаграмма иллюстрирует некоторые ключевые компоненты и то, как они взаимодействуют друг с другом! За ней последуют подробные описания и код для каждого компонента:
1️⃣ & 2️⃣ : Загрузка базы знаний База знаний — это коллекция актуальной и релевантной информации, которая служит основой для RAG. В нашем случае это репозиторий на GitHub! Вот как мы разбиваем и парсим нашу кодовую базу с помощью иерархического парсера кода от @Llama_Index:
3️⃣ Модель встраивания Встраивание — это значимое представление текста в виде чисел. Модель встраивания отвечает за создание встраиваний для частей документа и пользовательских запросов. Вот как мы загружаем нашу модель встраивания:
4️⃣ Индексация и хранение Встраивания, созданные моделью встраивания, хранятся в векторном хранилище, которое предлагает быструю выборку и поиск по сходству, создавая индекс по нашим данным. Мы будем использовать самохостимую векторную базу данных @Milvusio:
5️⃣ Создание шаблона запроса Пользовательский шаблон запроса используется для уточнения ответа от LLM и включает контекст:
6️⃣ Настройка движка запросов Движок запросов принимает строку запроса, чтобы использовать её для получения соответствующего контекста и комбинирует их с помощью шаблона подсказки перед отправкой в LLM, который генерирует окончательный ответ! LLM, используемая здесь, - это последняя версия Qwen3-Coder!
7️⃣ Интерфейс чата Мы создаем пользовательский интерфейс с помощью Streamlit, чтобы предоставить интерфейс чата для нашего приложения RAG. Код для этого и всего, что мы обсудили до сих пор, будет представлен в следующем твите! Посмотрите это👇
Бонус! Мы будем использовать AI кодекс @CleanlabAI, умный способ проверки и улучшения ваших ответов. Мы использовали то же самое для получения оценки надежности. Бесшовно интегрируется с любым агентным или AI чат-приложением, которое вы разрабатываете. Посмотрите это👇
Вы можете найти весь код в этом репозитории GitHub: (не забудьте поставить звезду 🌟)
Наконец, я оставлю вас с архитектурной схемой приложения, которое мы построили. Надеюсь, вам понравился этот урок. Оставайтесь с нами для новых материалов! 🥂
Если вы нашли это полезным, поделитесь с вашей сетью. Найдите меня → @akshay_pachaar ✔️ Для получения дополнительных сведений и учебных материалов по LLM, AI-агентам и машинному обучению!
Akshay 🚀
Akshay 🚀25 июл., 01:06
Давайте создадим приложение "Чат с вашим кодом" на основе Qwen3-Coder:
68,68K