Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Давайте создадим приложение "Чат с вашим кодом" на основе Qwen3-Coder:
Прежде чем мы начнем, взгляните на то, что мы собираемся создать!
Технологический стек:
- @Llama_Index для оркестрации
- @Milvusio для самостоятельного хостинга vectorDB
- @CleanlabAI codex для проверки ответа
- @OpenRouterAI для доступа к @Alibaba_Qwen 3 Coder.
Поехали! 🚀
Представленная ниже архитектурная диаграмма иллюстрирует некоторые ключевые компоненты и то, как они взаимодействуют друг с другом!
За ней последуют подробные описания и код для каждого компонента:
1️⃣ & 2️⃣ : Загрузка базы знаний
База знаний — это коллекция актуальной и релевантной информации, которая служит основой для RAG. В нашем случае это репозиторий на GitHub!
Вот как мы разбиваем и парсим нашу кодовую базу с помощью иерархического парсера кода от @Llama_Index:

3️⃣ Модель встраивания
Встраивание — это значимое представление текста в виде чисел.
Модель встраивания отвечает за создание встраиваний для частей документа и пользовательских запросов.
Вот как мы загружаем нашу модель встраивания:

4️⃣ Индексация и хранение
Встраивания, созданные моделью встраивания, хранятся в векторном хранилище, которое предлагает быструю выборку и поиск по сходству, создавая индекс по нашим данным.
Мы будем использовать самохостимую векторную базу данных @Milvusio:

5️⃣ Создание шаблона запроса
Пользовательский шаблон запроса используется для уточнения ответа от LLM и включает контекст:

6️⃣ Настройка движка запросов
Движок запросов принимает строку запроса, чтобы использовать её для получения соответствующего контекста и комбинирует их с помощью шаблона подсказки перед отправкой в LLM, который генерирует окончательный ответ!
LLM, используемая здесь, - это последняя версия Qwen3-Coder!

7️⃣ Интерфейс чата
Мы создаем пользовательский интерфейс с помощью Streamlit, чтобы предоставить интерфейс чата для нашего приложения RAG.
Код для этого и всего, что мы обсудили до сих пор, будет представлен в следующем твите!
Посмотрите это👇

Бонус!
Мы будем использовать AI кодекс @CleanlabAI, умный способ проверки и улучшения ваших ответов.
Мы использовали то же самое для получения оценки надежности.
Бесшовно интегрируется с любым агентным или AI чат-приложением, которое вы разрабатываете.
Посмотрите это👇

Вы можете найти весь код в этом репозитории GitHub:
(не забудьте поставить звезду 🌟)
Наконец, я оставлю вас с архитектурной схемой приложения, которое мы построили.
Надеюсь, вам понравился этот урок. Оставайтесь с нами для новых материалов! 🥂
Если вы нашли это полезным, поделитесь с вашей сетью.
Найдите меня → @akshay_pachaar ✔️
Для получения дополнительных сведений и учебных материалов по LLM, AI-агентам и машинному обучению!

25 июл., 01:06
Давайте создадим приложение "Чат с вашим кодом" на основе Qwen3-Coder:
68,68K
Топ
Рейтинг
Избранное