Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Não tenho mais certeza do que pensar sobre este livro.
Foi um livro fantástico durante uma época em que a maioria dessas ideias parecia valiosa, mas também é responsável por algumas das maiores atrocidades que já testemunhei.
Eu não recomendo mais que as pessoas leiam. Eu não tenho ido há algum tempo.

21,17K
É assim que você escreve um código 10x melhor com 10x menos esforço.
Agentes personalizados e especializados revisando seu código a cada passo do caminho.
Já vi revisões de código automatizadas antes, mas nunca com a capacidade de definir seus agentes de revisores personalizados. @baz_scm é o primeiro a fazer isso, e é muito legal.
Existem três tipos de agentes de revisor:
1. Os que saem da caixa.
Esses agentes cobrem os padrões mais comuns que todos desejam verificar: código duplicado, código quebrado, código complexo etc.
2. Agentes de revisores recomendados que o Baz cria para você automaticamente.
O Baz analisa seu histórico de avaliações e comentários anteriores para identificar padrões importantes para você e, em seguida, cria automaticamente agentes especializados em verificar esses padrões.
Por exemplo, se você sempre pedir a seus desenvolvedores para manter arquivos com menos de 100 linhas de código, o Baz irá detectá-lo e criar um agente personalizado que verifica isso.
3. Agentes de revisores personalizados que você define.
Estes são os meus favoritos: Escreva um prompt explicando suas regras e seu agente começará a verificar seu código para sinalizar qualquer coisa que corresponda às regras.
Criei um agente revisor simples no vídeo em anexo.
Honestamente, neste momento, você não tem desculpa para enviar código ruim.
Aqui está um link para você experimentar esses agentes de revisores personalizados:
Obrigado à equipe @baz_scm por colaborar comigo neste post.
31,42K
Honestamente, a maioria dos desenvolvedores de IA ainda está presa no século passado.
Fico impressionado com o quão poucas pessoas estão cientes da Análise de Erros.
Esta é *literalmente* a maneira mais rápida e eficaz de avaliar aplicativos de IA, e a maioria das equipes ainda está presa perseguindo fantasmas.
Pare de rastrear métricas genéricas e siga estas etapas:
1. Colete amostras de falha
Comece a revisar as respostas geradas por sua inscrição. Escreva notas sobre cada resposta, especialmente aquelas que foram erros. Você não precisa formatar suas anotações de nenhuma maneira específica. Concentre-se em descrever o que deu errado com a resposta.
2. Categorize suas anotações
Depois de revisar um bom conjunto de respostas, faça um LLM e peça para encontrar padrões comuns em suas anotações. Peça-lhe para classificar cada nota com base nesses padrões.
Você acabará com categorias que cobrem todos os tipos de erros cometidos por sua inscrição.
3. Diagnostique os erros mais frequentes
Comece concentrando-se no tipo mais comum de erro. Você não quer perder tempo trabalhando com erros raros.
Aprofunde-se nas conversas, entradas e registros que levam a essas amostras incorretas. Tente entender o que pode estar causando os problemas.
4. Projete correções direcionadas
Neste ponto, você deseja determinar como eliminar os erros diagnosticados na etapa anterior da maneira mais rápida e barata possível.
Por exemplo, você pode ajustar seus prompts, adicionar regras de validação extras, encontrar mais dados de treinamento ou modificar o modelo.
5. Automatize o processo de avaliação
Você precisa implementar um processo simples para executar novamente um conjunto de avaliação por meio de seu aplicativo e avaliar se suas correções foram eficazes.
Minha recomendação é usar um LLM-as-a-Judge para executar amostras por meio do aplicativo, pontuá-las com uma tag PASS/FAIL e calcular os resultados.
6. Fique de olho em suas métricas
Cada categoria identificada durante a análise de erros é uma métrica que você deseja acompanhar ao longo do tempo.
Você não chegará a lugar nenhum obcecado com "relevância", "correção", "integridade", "coerência" e quaisquer outras métricas prontas para uso. Esqueça isso e concentre-se nos problemas reais que você encontrou.

49,28K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável