DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Låt oss bygga en "Chatta med din kod" RAG-app med Qwen3-Coder:

Innan vi börjar, ta en titt på vad vi är på väg att skapa! Teknisk stack: - @Llama_Index för orkestrering - @Milvusio man själv hostar en vectorDB - @CleanlabAI codex för att validera svaret - @OpenRouterAI för att komma åt @Alibaba_Qwen 3 Coder. Kom så går vi! 🚀

Arkitekturdiagrammet som presenteras nedan illustrerar några av de viktigaste komponenterna och hur de interagerar med varandra! Det kommer att följas av detaljerade beskrivningar och kod för varje komponent:

1️⃣ & 2️⃣ : Laddar kunskapsbasen En kunskapsbas är en samling relevant och aktuell information som ligger till grund för RAG. I vårt fall är det ett GitHub-arkiv! Så här delar vi upp och tolkar vår kodbas med hjälp av @Llama_Index:s hierarkiska kodparser:

3️⃣ Modellen för inbäddning Inbäddning är en meningsfull representation av text i form av siffror. Inbäddningsmodellen ansvarar för att skapa inbäddningar för dokumentsegment och användarfrågor. Så här läser vi in vår inbäddningsmodell:

4️⃣ Indexering och lagring Inbäddningar som skapas av inbäddningsmodellen lagras i ett vektorlager som erbjuder snabb hämtning och likhetssökning genom att skapa ett index över våra data. Vi använder en @Milvusio vektordatabas med egen värd:

5️⃣ Skapa en promptmall En anpassad promptmall används för att förfina svaret från LLM och även inkludera sammanhanget:

6️⃣ Konfigurera en frågemotor Frågemotorn tar frågesträngen för att använda den för att hämta relevant sammanhang och kombinerar dem med hjälp av promptmallen innan den skickas till LLM som genererar slutligt svar! Den LLM som används här är den senaste Qwen3-Coder!

7️⃣ Chattens gränssnitt Vi skapar ett användargränssnitt med hjälp av Streamlit för att tillhandahålla ett chattgränssnitt för vår RAG-applikation. Koden för detta och allt vi diskuterat hittills delas i nästa tweet! Kolla in det här👇

Bonus! Vi kommer att använda @CleanlabAI:s AI-kodex, ett smart sätt att validera och förbättra dina svar. Vi har använt samma för att få tillförlitlighetspoängen. Integreras sömlöst med alla agent- eller AI-chattapplikationer du utvecklar. Kolla in det här👇

Du hittar all kod på den här GitHub-lagringsplatsen: (glöm inte att stjärna 🌟)

Slutligen lämnar jag dig med arkitekturdiagrammet för appen vi har byggt. Hoppas du gillade den här guiden. Håll ögonen öppna för mer! 🥂

Om du tyckte att det var insiktsfullt, dela det igen med ditt nätverk. Hitta mig → @akshay_pachaar ✔️ För fler insikter och handledningar om LLM:er, AI-agenter och maskininlärning!

68,69K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda