Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Ik weet niet meer wat ik van dit boek moet denken.
Het was een fantastisch boek in een tijd waarin de meeste van deze ideeën waardevol leken, maar het is ook verantwoordelijk voor enkele van de grootste gruwelijkheden die ik heb meegemaakt.
Ik raad mensen niet langer aan om het te lezen. Ik ben al een tijdje niet meer bezig geweest.

21,17K
Dit is hoe je 10x beter code schrijft met 10x minder moeite.
Aangepaste, gespecialiseerde agenten die je code elke stap van de weg beoordelen.
Ik heb eerder geautomatiseerde codebeoordelingen gezien, maar nooit met de mogelijkheid om je eigen beoordelingsagenten te definiëren. @baz_scm is de eerste die dit voor elkaar krijgt, en het is best cool.
Er zijn drie soorten beoordelingsagenten:
1. De agenten die direct uit de doos komen.
Deze agenten dekken de meest voorkomende patronen die iedereen wil controleren: gedupliceerde code, gebroken code, complexe code, enz.
2. Aanbevolen beoordelingsagenten die Baz automatisch voor je creëert.
Baz analyseert je beoordelingsgeschiedenis en eerdere opmerkingen om patronen te identificeren die je belangrijk vindt, en creëert vervolgens automatisch agenten die gespecialiseerd zijn in het controleren van die patronen.
Bijvoorbeeld, als je altijd je ontwikkelaars vraagt om bestanden onder de 100 regels code te houden, zal Baz dit detecteren en een aangepaste agent creëren die dat controleert.
3. Aangepaste beoordelingsagenten die je zelf definieert.
Dit zijn mijn favorieten: schrijf een prompt waarin je je regels uitlegt, en je agent begint je code te controleren om alles te markeren dat overeenkomt met de regels.
Ik heb een eenvoudige beoordelingsagent gemaakt in de bijgevoegde video.
Eerlijk gezegd, op dit punt heb je geen excuus meer om slechte code te verzenden.
Hier is een link voor jou om deze aangepaste beoordelingsagenten uit te proberen:
Bedankt aan het @baz_scm-team voor de samenwerking aan deze post.
31,42K
Eerlijk gezegd zitten de meeste AI-ontwikkelaars nog steeds vast in de vorige eeuw.
Het verbaast me hoe weinig mensen zich bewust zijn van Foutanalyse.
Dit is *letterlijk* de snelste en meest effectieve manier om AI-toepassingen te evalueren, en de meeste teams zijn nog steeds bezig met het achtervolgen van schimmen.
Alsjeblieft, stop met het volgen van generieke statistieken en volg deze stappen:
1. Verzamel foutmonsters
Begin met het beoordelen van de reacties die door je toepassing zijn gegenereerd. Schrijf aantekeningen over elke reactie, vooral diegene die fouten waren. Je hoeft je aantekeningen niet op een specifieke manier te formatteren. Focus op het beschrijven van wat er misging met de reactie.
2. Categoriseer je aantekeningen
Nadat je een goede set reacties hebt beoordeeld, neem een LLM en vraag het om gemeenschappelijke patronen in je aantekeningen te vinden. Vraag het om elke aantekening te classificeren op basis van deze patronen.
Je eindigt met categorieën die elk type fout dekken dat je toepassing heeft gemaakt.
3. Diagnoseer de meest voorkomende fouten
Begin met het focussen op het meest voorkomende type fout. Je wilt geen tijd verspillen aan zeldzame fouten.
Duik in de gesprekken, invoer en logboeken die leiden tot die onjuiste monsters. Probeer te begrijpen wat de problemen zou kunnen veroorzaken.
4. Ontwerp gerichte oplossingen
Op dit punt wil je bepalen hoe je de fouten die je in de vorige stap hebt gediagnosticeerd zo snel en goedkoop mogelijk kunt elimineren.
Bijvoorbeeld, je zou je prompts kunnen aanpassen, extra validatieregels kunnen toevoegen, meer trainingsdata kunnen vinden of het model kunnen aanpassen.
5. Automatiseer het evaluatieproces
Je moet een eenvoudig proces implementeren om een evaluatieset opnieuw door je toepassing te laten draaien en te evalueren of je oplossingen effectief waren.
Mijn aanbeveling is om een LLM-as-een-Rechter te gebruiken om monsters door de toepassing te laten lopen, ze te scoren met een PASS/FAIL-tag en de resultaten te berekenen.
6. Houd je statistieken in de gaten
Elke categorie die je tijdens de foutanalyse hebt geïdentificeerd, is een statistiek die je in de loop van de tijd wilt volgen.
Je komt nergens door te obsessief bezig te zijn met "relevantie", "correctheid", "volledigheid", "coherentie" en andere standaardstatistieken. Vergeet deze en focus op de echte problemen die je hebt gevonden.

49,28K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste