Zbudujmy aplikację RAG "Czat z twoim kodem" używając Qwen3-Coder:
Zanim zaczniemy, spójrz na to, co zamierzamy stworzyć! Stos technologiczny: - @Llama_Index do orkiestracji - @Milvusio do samodzielnego hostowania vectorDB - @CleanlabAI codex do walidacji odpowiedzi - @OpenRouterAI do uzyskania dostępu do @Alibaba_Qwen 3 Coder. Zaczynajmy! 🚀
Diagram architektury przedstawiony poniżej ilustruje niektóre z kluczowych komponentów oraz to, jak ze sobą współdziałają! Będzie on następnie uzupełniony szczegółowymi opisami i kodem dla każdego komponentu:
1️⃣ & 2️⃣ : Ładowanie bazy wiedzy Baza wiedzy to zbiór istotnych i aktualnych informacji, które stanowią fundament dla RAG. W naszym przypadku to repozytorium GitHub! Oto jak dzielimy i analizujemy naszą bazę kodu za pomocą hierarchicznego parsera kodu @Llama_Index:
3️⃣ Model osadzania Osadzenie to znacząca reprezentacja tekstu w formie liczb. Model osadzania jest odpowiedzialny za tworzenie osadzeń dla fragmentów dokumentów i zapytań użytkowników. Oto jak ładujemy nasz model osadzania:
4️⃣ Indeksowanie i przechowywanie Osadzenia stworzone przez model osadzeń są przechowywane w magazynie wektorów, który oferuje szybkie wyszukiwanie i wyszukiwanie podobieństw poprzez tworzenie indeksu nad naszymi danymi. Użyjemy samodzielnie hostowanej bazy danych wektorów @Milvusio:
5️⃣ Tworzenie szablonu zapytania Niestandardowy szablon zapytania jest używany do udoskonalenia odpowiedzi z LLM i uwzględnienia kontekstu:
6️⃣ Ustawienie silnika zapytań Silnik zapytań przyjmuje ciąg zapytania, aby wykorzystać go do pobrania odpowiedniego kontekstu i łączy je za pomocą szablonu promptu, zanim wyśle go do LLM, który generuje ostateczną odpowiedź! LLM używany tutaj to najnowszy Qwen3-Coder!
7️⃣ Interfejs czatu Tworzymy interfejs użytkownika za pomocą Streamlit, aby zapewnić interfejs czatu dla naszej aplikacji RAG. Kod do tego oraz wszystko, o czym rozmawialiśmy do tej pory, zostanie udostępniony w następnym tweecie! Sprawdź to👇
Bonus! Użyjemy AI codex od @CleanlabAI, inteligentnego sposobu na weryfikację i poprawę Twoich odpowiedzi. Użyliśmy tego samego do uzyskania wyniku wiarygodności. Bezproblemowo integruje się z każdą aplikacją czatu agentowego lub AI, którą rozwijasz. Sprawdź to👇
Możesz znaleźć cały kod w tym repozytorium GitHub: (nie zapomnij dodać gwiazdki 🌟)
Na koniec zostawiam was z diagramem architektury aplikacji, którą zbudowaliśmy. Mam nadzieję, że podobał wam się ten samouczek. Bądźcie na bieżąco z kolejnymi! 🥂
Jeśli uważasz go za wnikliwy, udostępnij go ponownie w swojej sieci. Znajdź mnie → @akshay_pachaar ✔️ Aby uzyskać więcej szczegółowych informacji i samouczków na temat LLM, agentów AI i uczenia maszynowego!
Akshay 🚀
Akshay 🚀25 lip, 01:06
Zbudujmy aplikację RAG "Czat z twoim kodem" używając Qwen3-Coder:
68,69K