Să construim o aplicație RAG "Chat with your Code" folosind Qwen3-Coder:
Înainte de a începe, aruncă o privire la ceea ce urmează să creăm! Stiva tehnologică: - @Llama_Index pentru orchestrare - @Milvusio pentru a găzdui un vectorDB - @CleanlabAI codex pentru a valida răspunsul - @OpenRouterAI pentru a accesa @Alibaba_Qwen 3 Coder. Să mergem! 🚀
Diagrama arhitecturii prezentată mai jos ilustrează câteva dintre componentele cheie și modul în care acestea interacționează între ele! Acesta va fi urmat de descrieri detaliate și cod pentru fiecare componentă:
1️⃣ & 2️⃣ : Încărcarea bazei de cunoștințe O bază de cunoștințe este o colecție de informații relevante și actualizate care servește drept bază pentru RAG. În cazul nostru, este un depozit GitHub! Iată cum ne fragmentăm și analizăm baza de cod folosind analizorul de cod ierarhic @Llama_Index:
3️⃣ Modelul de încorporare Încorporarea este o reprezentare semnificativă a textului sub formă de numere. Modelul de încorporare este responsabil pentru crearea încorporarilor pentru bucățile de document și interogările utilizatorului. Iată cum încărcăm modelul nostru de încorporare:
4️⃣ Indexare și stocare Încorporarea creată prin modelul de încorporare este stocată într-un depozit vectorial care oferă recuperare rapidă și căutare de similitudine prin crearea unui index peste datele noastre. Vom folosi o bază de date vectorială @Milvusio auto-găzduită:
5️⃣ Crearea unui șablon de solicitare Un șablon de solicitare personalizat este utilizat pentru a rafina răspunsul de la LLM și pentru a include și contextul:
6️⃣ Configurarea unui motor de interogare Motorul de interogare preia șirul de interogare pentru a-l folosi pentru a prelua contextul relevant și le combină folosind șablonul de prompt înainte de a-l trimite la LLM care generează răspunsul final! LLM-ul folosit aici este cel mai recent Qwen3-Coder!
7️⃣ Interfața de chat Creăm o interfață de utilizare folosind Streamlit pentru a oferi o interfață de chat pentru aplicația noastră RAG. Codul pentru asta și tot ceea ce am discutat până acum este împărtășit în următorul tweet! Verifică👇 asta
Bonus! Vom folosi codexul AI al @CleanlabAI, o modalitate inteligentă de a vă valida și îmbunătăți răspunsurile. Am folosit același lucru pentru a obține scorul de încredere. Se integrează perfect cu orice aplicație de chat agentic sau AI pe care o dezvoltați. Verifică👇 asta
Puteți găsi tot codul în acest depozit GitHub: (nu uitați să vedeți 🌟)
În cele din urmă, vă las cu diagrama de arhitectură a aplicației pe care am construit-o. Sper că ți-a plăcut acest tutorial. Rămâneți pe fază pentru mai multe! 🥂
Dacă ți s-a părut util, redistribui cu rețeaua ta. Găsește-mă → @akshay_pachaar ✔️ Pentru mai multe informații și tutoriale despre LLM-uri, agenți AI și învățare automată!
Akshay 🚀
Akshay 🚀25 iul., 01:06
Să construim o aplicație RAG "Chat with your Code" folosind Qwen3-Coder:
68,7K