Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Zbudujmy aplikację RAG "Czat z twoim kodem" używając Qwen3-Coder:
Zanim zaczniemy, spójrz na to, co zamierzamy stworzyć!
Stos technologiczny:
- @Llama_Index do orkiestracji
- @Milvusio do samodzielnego hostowania vectorDB
- @CleanlabAI codex do walidacji odpowiedzi
- @OpenRouterAI do uzyskania dostępu do @Alibaba_Qwen 3 Coder.
Zaczynajmy! 🚀
Diagram architektury przedstawiony poniżej ilustruje niektóre z kluczowych komponentów oraz to, jak ze sobą współdziałają!
Będzie on następnie uzupełniony szczegółowymi opisami i kodem dla każdego komponentu:
1️⃣ & 2️⃣ : Ładowanie bazy wiedzy
Baza wiedzy to zbiór istotnych i aktualnych informacji, które stanowią fundament dla RAG. W naszym przypadku to repozytorium GitHub!
Oto jak dzielimy i analizujemy naszą bazę kodu za pomocą hierarchicznego parsera kodu @Llama_Index:

3️⃣ Model osadzania
Osadzenie to znacząca reprezentacja tekstu w formie liczb.
Model osadzania jest odpowiedzialny za tworzenie osadzeń dla fragmentów dokumentów i zapytań użytkowników.
Oto jak ładujemy nasz model osadzania:

4️⃣ Indeksowanie i przechowywanie
Osadzenia stworzone przez model osadzeń są przechowywane w magazynie wektorów, który oferuje szybkie wyszukiwanie i wyszukiwanie podobieństw poprzez tworzenie indeksu nad naszymi danymi.
Użyjemy samodzielnie hostowanej bazy danych wektorów @Milvusio:

5️⃣ Tworzenie szablonu zapytania
Niestandardowy szablon zapytania jest używany do udoskonalenia odpowiedzi z LLM i uwzględnienia kontekstu:

6️⃣ Ustawienie silnika zapytań
Silnik zapytań przyjmuje ciąg zapytania, aby wykorzystać go do pobrania odpowiedniego kontekstu i łączy je za pomocą szablonu promptu, zanim wyśle go do LLM, który generuje ostateczną odpowiedź!
LLM używany tutaj to najnowszy Qwen3-Coder!

7️⃣ Interfejs czatu
Tworzymy interfejs użytkownika za pomocą Streamlit, aby zapewnić interfejs czatu dla naszej aplikacji RAG.
Kod do tego oraz wszystko, o czym rozmawialiśmy do tej pory, zostanie udostępniony w następnym tweecie!
Sprawdź to👇

Bonus!
Użyjemy AI codex od @CleanlabAI, inteligentnego sposobu na weryfikację i poprawę Twoich odpowiedzi.
Użyliśmy tego samego do uzyskania wyniku wiarygodności.
Bezproblemowo integruje się z każdą aplikacją czatu agentowego lub AI, którą rozwijasz.
Sprawdź to👇

Możesz znaleźć cały kod w tym repozytorium GitHub:
(nie zapomnij dodać gwiazdki 🌟)
Na koniec zostawiam was z diagramem architektury aplikacji, którą zbudowaliśmy.
Mam nadzieję, że podobał wam się ten samouczek. Bądźcie na bieżąco z kolejnymi! 🥂
Jeśli uważasz go za wnikliwy, udostępnij go ponownie w swojej sieci.
Znajdź mnie → @akshay_pachaar ✔️
Aby uzyskać więcej szczegółowych informacji i samouczków na temat LLM, agentów AI i uczenia maszynowego!

25 lip, 01:06
Zbudujmy aplikację RAG "Czat z twoim kodem" używając Qwen3-Coder:
68,69K
Najlepsze
Ranking
Ulubione