Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Nie jestem już pewien, co myśleć o tej książce.
To była fantastyczna książka w czasie, gdy większość tych pomysłów wydawała się wartościowa, ale jest też odpowiedzialna za niektóre z największych okropności, jakich byłem świadkiem.
Już nie polecam ludziom jej czytać. Nie byłem w to wciągnięty od jakiegoś czasu.

21,16K
Tak piszesz kod 10x lepszy przy 10x mniejszym wysiłku.
Dostosowani, wyspecjalizowani agenci przeglądający Twój kod na każdym etapie.
Widziałem wcześniej zautomatyzowane przeglądy kodu, ale nigdy z możliwością definiowania własnych agentów recenzentów. @baz_scm jest pierwszym, który to zrealizował, i to jest naprawdę fajne.
Są trzy rodzaje agentów recenzentów:
1. Ci, którzy są dostępni od razu.
Ci agenci obejmują najczęstsze wzorce, które każdy chce sprawdzić: zduplikowany kod, uszkodzony kod, skomplikowany kod itp.
2. Rekomendowani agenci recenzenci, których Baz tworzy automatycznie dla Ciebie.
Baz analizuje Twoją historię przeglądów i wcześniejsze komentarze, aby zidentyfikować wzorce, na których Ci zależy, a następnie automatycznie tworzy agentów wyspecjalizowanych w sprawdzaniu tych wzorców.
Na przykład, jeśli zawsze prosisz swoich programistów, aby trzymali pliki poniżej 100 linii kodu, Baz to wykryje i stworzy dostosowanego agenta, który to sprawdzi.
3. Dostosowani agenci recenzenci, których definiujesz.
To są moi ulubieni: Napisz prompt wyjaśniający Twoje zasady, a Twój agent zacznie sprawdzać Twój kod, aby oznaczyć wszystko, co pasuje do zasad.
Stworzyłem prostego agenta recenzenta w załączonym wideo.
Szczerze mówiąc, w tym momencie nie masz wymówki, aby wysyłać zły kod.
Oto link, abyś mógł wypróbować tych dostosowanych agentów recenzentów:
Dzięki zespołowi @baz_scm za współpracę przy tym poście.
30,92K
Szczerze mówiąc, większość deweloperów AI wciąż utknęła w ubiegłym wieku.
Zdumiewa mnie, jak mało osób jest świadomych Analizy Błędów.
To *dosłownie* najszybszy i najskuteczniejszy sposób oceny aplikacji AI, a większość zespołów wciąż goni za duchami.
Proszę, przestańcie śledzić ogólne metryki i postępujcie zgodnie z tymi krokami:
1. Zbieraj próbki błędów
Zacznij przeglądać odpowiedzi generowane przez twoją aplikację. Zapisuj notatki o każdej odpowiedzi, szczególnie tych, które były błędne. Nie musisz formatować swoich notatek w żaden szczególny sposób. Skup się na opisie tego, co poszło nie tak w odpowiedzi.
2. Kategoryzuj swoje notatki
Po przeglądnięciu dobrej liczby odpowiedzi, weź LLM i poproś go o znalezienie wspólnych wzorców w twoich notatkach. Poproś go o sklasyfikowanie każdej notatki na podstawie tych wzorców.
Zakończysz z kategoriami obejmującymi każdy typ błędu, który popełniła twoja aplikacja.
3. Zdiagnozuj najczęstsze błędy
Zacznij od skupienia się na najczęstszym typie błędu. Nie chcesz tracić czasu na rzadkie błędy.
Zagłęb się w rozmowy, dane wejściowe i logi prowadzące do tych niepoprawnych próbek. Spróbuj zrozumieć, co może powodować problemy.
4. Zaprojektuj ukierunkowane poprawki
Na tym etapie chcesz określić, jak najszybciej i najtaniej wyeliminować błędy, które zdiagnozowałeś w poprzednim kroku.
Na przykład, możesz dostosować swoje zapytania, dodać dodatkowe zasady walidacji, znaleźć więcej danych do treningu lub zmodyfikować model.
5. Zautomatyzuj proces oceny
Musisz wdrożyć prosty proces, aby ponownie uruchomić zestaw oceny przez swoją aplikację i ocenić, czy twoje poprawki były skuteczne.
Moja rekomendacja to użycie LLM jako sędziego do uruchamiania próbek przez aplikację, oceniania ich za pomocą tagu PASS/FAIL i obliczania wyników.
6. Zwracaj uwagę na swoje metryki
Każda kategoria, którą zidentyfikowałeś podczas analizy błędów, jest metryką, którą chcesz śledzić w czasie.
Nie zajdziesz daleko obsesyjnie skupiając się na "relewantności", "poprawności", "kompletności", "spójności" i innych gotowych metrykach. Zapomnij o nich i skup się na prawdziwych problemach, które znalazłeś.

49,09K
Użytkownik Santiago udostępnił ponownie
To jest Kiro - AI IDE, który naprawdę działa w Twoich chaotycznych, rzeczywistych projektach. Inne narzędzia AI tracą kontekst, gdy projekty stają się złożone. Kiro oferuje rozwój oparty na specyfikacjach, który skaluje się poza prototypy.
Darmowy podgląd dostępny teraz
#KiroDotDev
215,74K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi