Давайте створимо додаток "Chat with your Code" RAG за допомогою Qwen3-Coder:
Перш ніж ми почнемо, подивіться, що ми збираємося створити! Технологічний стек: - @Llama_Index для оркестровки - @Milvusio для самостійного розміщення vectorDB - @CleanlabAI кодекс для перевірки відповіді - @OpenRouterAI отримати доступ до @Alibaba_Qwen 3 Кодера. Пішли! 🚀
Діаграма архітектури, представлена нижче, ілюструє деякі з ключових компонентів і те, як вони взаємодіють один з одним! Далі будуть детальні описи та код для кожного компонента:
1️⃣ & 2️⃣ : Завантаження бази знань База знань – це сукупність актуальної та актуальної інформації, яка слугує фундаментом для RAG. У нашому випадку це репозиторій на GitHub! Ось як ми шматуємо та аналізуємо нашу кодову базу за допомогою ієрархічного аналізатора коду @Llama_Index:
3️⃣ Модель вбудовування Вбудовування – це осмислене представлення тексту у вигляді чисел. Модель вбудовування відповідає за створення вбудовувань для фрагментів документа та запитів користувачів. Ось як ми завантажуємо нашу модель вбудовування:
4️⃣ Індексація та зберігання Вкладення, створені за допомогою моделі вбудовування, зберігаються у векторному сховищі, яке забезпечує швидкий пошук та пошук подібності шляхом створення індексу над нашими даними. Ми будемо використовувати власну базу даних @Milvusio векторів:
5️⃣ Створення шаблону підказки Користувацький шаблон запиту використовується для уточнення відповіді з LLM, а також для включення контексту:
6️⃣ Налаштування движка запитів Двигун запитів бере рядок запиту, щоб використовувати його для отримання відповідного контексту, і комбінує їх за допомогою шаблону запиту перед надсиланням його до LLM, який генерує остаточну відповідь! LLM, який використовується тут, є найновішим Qwen3-Coder!
7️⃣ Інтерфейс чату Ми створюємо інтерфейс користувача за допомогою Streamlit, щоб забезпечити інтерфейс чату для нашої програми RAG. Код для цього та всього, що ми обговорювали досі, наведено в наступному твіті! Перевірте👇 це
Бонус! Ми використовуватимемо AI-кодекс @CleanlabAI – розумний спосіб перевірки та покращення ваших відповідей. Ми використовували його для отримання оцінки надійності. Легко інтегрується з будь-яким агентським або штучним інтелектом чат-додатком, який ви розробляєте. Перевірте👇 це
Ви можете знайти весь код у цьому репозиторії GitHub: (не забудьте поставити зірочку 🌟)
Нарешті, я залишу вам діаграму архітектури програми, яку ми створили. Сподіваюся, вам сподобався цей урок. Слідкуйте за новинами! 🥂
Якщо ви вважаєте її корисною, надішліть запит у свою мережу. Знайди мене → @akshay_pachaar ✔️ Щоб отримати більше інформації та навчальних посібників про LLM, агентів штучного інтелекту та машинне навчання!
Akshay 🚀
Akshay 🚀25 лип., 01:06
Давайте створимо додаток "Chat with your Code" RAG за допомогою Qwen3-Coder:
68,68K