Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Давайте створимо додаток "Chat with your Code" RAG за допомогою Qwen3-Coder:
Перш ніж ми почнемо, подивіться, що ми збираємося створити!
Технологічний стек:
- @Llama_Index для оркестровки
- @Milvusio для самостійного розміщення vectorDB
- @CleanlabAI кодекс для перевірки відповіді
- @OpenRouterAI отримати доступ до @Alibaba_Qwen 3 Кодера.
Пішли! 🚀
Діаграма архітектури, представлена нижче, ілюструє деякі з ключових компонентів і те, як вони взаємодіють один з одним!
Далі будуть детальні описи та код для кожного компонента:
1️⃣ & 2️⃣ : Завантаження бази знань
База знань – це сукупність актуальної та актуальної інформації, яка слугує фундаментом для RAG. У нашому випадку це репозиторій на GitHub!
Ось як ми шматуємо та аналізуємо нашу кодову базу за допомогою ієрархічного аналізатора коду @Llama_Index:

3️⃣ Модель вбудовування
Вбудовування – це осмислене представлення тексту у вигляді чисел.
Модель вбудовування відповідає за створення вбудовувань для фрагментів документа та запитів користувачів.
Ось як ми завантажуємо нашу модель вбудовування:

4️⃣ Індексація та зберігання
Вкладення, створені за допомогою моделі вбудовування, зберігаються у векторному сховищі, яке забезпечує швидкий пошук та пошук подібності шляхом створення індексу над нашими даними.
Ми будемо використовувати власну базу даних @Milvusio векторів:

5️⃣ Створення шаблону підказки
Користувацький шаблон запиту використовується для уточнення відповіді з LLM, а також для включення контексту:

6️⃣ Налаштування движка запитів
Двигун запитів бере рядок запиту, щоб використовувати його для отримання відповідного контексту, і комбінує їх за допомогою шаблону запиту перед надсиланням його до LLM, який генерує остаточну відповідь!
LLM, який використовується тут, є найновішим Qwen3-Coder!

7️⃣ Інтерфейс чату
Ми створюємо інтерфейс користувача за допомогою Streamlit, щоб забезпечити інтерфейс чату для нашої програми RAG.
Код для цього та всього, що ми обговорювали досі, наведено в наступному твіті!
Перевірте👇 це

Бонус!
Ми використовуватимемо AI-кодекс @CleanlabAI – розумний спосіб перевірки та покращення ваших відповідей.
Ми використовували його для отримання оцінки надійності.
Легко інтегрується з будь-яким агентським або штучним інтелектом чат-додатком, який ви розробляєте.
Перевірте👇 це

Ви можете знайти весь код у цьому репозиторії GitHub:
(не забудьте поставити зірочку 🌟)
Нарешті, я залишу вам діаграму архітектури програми, яку ми створили.
Сподіваюся, вам сподобався цей урок. Слідкуйте за новинами! 🥂
Якщо ви вважаєте її корисною, надішліть запит у свою мережу.
Знайди мене → @akshay_pachaar ✔️
Щоб отримати більше інформації та навчальних посібників про LLM, агентів штучного інтелекту та машинне навчання!

25 лип., 01:06
Давайте створимо додаток "Chat with your Code" RAG за допомогою Qwen3-Coder:
68,68K
Найкращі
Рейтинг
Вибране