Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Låt oss bygga en "Chatta med din kod" RAG-app med Qwen3-Coder:
Innan vi börjar, ta en titt på vad vi är på väg att skapa!
Teknisk stack:
- @Llama_Index för orkestrering
- @Milvusio man själv hostar en vectorDB
- @CleanlabAI codex för att validera svaret
- @OpenRouterAI för att komma åt @Alibaba_Qwen 3 Coder.
Kom så går vi! 🚀
Arkitekturdiagrammet som presenteras nedan illustrerar några av de viktigaste komponenterna och hur de interagerar med varandra!
Det kommer att följas av detaljerade beskrivningar och kod för varje komponent:
1️⃣ & 2️⃣ : Laddar kunskapsbasen
En kunskapsbas är en samling relevant och aktuell information som ligger till grund för RAG. I vårt fall är det ett GitHub-arkiv!
Så här delar vi upp och tolkar vår kodbas med hjälp av @Llama_Index:s hierarkiska kodparser:

3️⃣ Modellen för inbäddning
Inbäddning är en meningsfull representation av text i form av siffror.
Inbäddningsmodellen ansvarar för att skapa inbäddningar för dokumentsegment och användarfrågor.
Så här läser vi in vår inbäddningsmodell:

4️⃣ Indexering och lagring
Inbäddningar som skapas av inbäddningsmodellen lagras i ett vektorlager som erbjuder snabb hämtning och likhetssökning genom att skapa ett index över våra data.
Vi använder en @Milvusio vektordatabas med egen värd:

5️⃣ Skapa en promptmall
En anpassad promptmall används för att förfina svaret från LLM och även inkludera sammanhanget:

6️⃣ Konfigurera en frågemotor
Frågemotorn tar frågesträngen för att använda den för att hämta relevant sammanhang och kombinerar dem med hjälp av promptmallen innan den skickas till LLM som genererar slutligt svar!
Den LLM som används här är den senaste Qwen3-Coder!

7️⃣ Chattens gränssnitt
Vi skapar ett användargränssnitt med hjälp av Streamlit för att tillhandahålla ett chattgränssnitt för vår RAG-applikation.
Koden för detta och allt vi diskuterat hittills delas i nästa tweet!
Kolla in det här👇

Bonus!
Vi kommer att använda @CleanlabAI:s AI-kodex, ett smart sätt att validera och förbättra dina svar.
Vi har använt samma för att få tillförlitlighetspoängen.
Integreras sömlöst med alla agent- eller AI-chattapplikationer du utvecklar.
Kolla in det här👇

Du hittar all kod på den här GitHub-lagringsplatsen:
(glöm inte att stjärna 🌟)
Slutligen lämnar jag dig med arkitekturdiagrammet för appen vi har byggt.
Hoppas du gillade den här guiden. Håll ögonen öppna för mer! 🥂
Om du tyckte att det var insiktsfullt, dela det igen med ditt nätverk.
Hitta mig → @akshay_pachaar ✔️
För fler insikter och handledningar om LLM:er, AI-agenter och maskininlärning!

25 juli 01:06
Låt oss bygga en "Chatta med din kod" RAG-app med Qwen3-Coder:
68,69K
Topp
Rankning
Favoriter