Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Ya no estoy seguro de qué pensar sobre este libro.
Fue un libro fantástico en un momento en que la mayoría de estas ideas parecían valiosas, pero también es responsable de algunas de las mayores atrocidades que he presenciado.
Ya no recomiendo a la gente que lo lea. No he estado en ello desde hace un tiempo.

21,18K
Así es como escribes código 10 veces mejor con 10 veces menos esfuerzo.
Agentes personalizados y especializados revisando tu código en cada paso del camino.
He visto revisiones de código automatizadas antes, pero nunca con la capacidad de definir tus propios agentes revisores. @baz_scm es el primero en lograrlo, y es bastante genial.
Hay tres tipos de agentes revisores:
1. Los que vienen listos para usar.
Estos agentes cubren los patrones más comunes que todos quieren verificar: código duplicado, código roto, código complejo, etc.
2. Agentes revisores recomendados que Baz crea automáticamente para ti.
Baz analiza tu historial de revisiones y comentarios pasados para identificar patrones que te importan, y luego crea automáticamente agentes especializados en verificar esos patrones.
Por ejemplo, si siempre pides a tus desarrolladores que mantengan los archivos por debajo de 100 líneas de código, Baz lo detectará y creará un agente personalizado que verifique eso.
3. Agentes revisores personalizados que tú defines.
Estos son mis favoritos: Escribe un aviso explicando tus reglas, y tu agente comenzará a revisar tu código para señalar cualquier cosa que coincida con las reglas.
Creé un agente revisor simple en el video adjunto.
Honestamente, en este punto, no tienes excusa para enviar código malo.
Aquí hay un enlace para que pruebes estos agentes revisores personalizados:
Gracias al equipo de @baz_scm por colaborar conmigo en esta publicación.
31,43K
Honestamente, la mayoría de los desarrolladores de IA todavía están atrapados en el siglo pasado.
Me sorprende cuántas pocas personas son conscientes del Análisis de Errores.
Esta es *literalmente* la forma más rápida y efectiva de evaluar aplicaciones de IA, y la mayoría de los equipos todavía están persiguiendo fantasmas.
Por favor, dejen de rastrear métricas genéricas y sigan estos pasos:
1. Recopilar muestras de fallos
Comience a revisar las respuestas generadas por su aplicación. Escriba notas sobre cada respuesta, especialmente aquellas que fueron errores. No necesita formatear sus notas de ninguna manera específica. Concéntrese en describir qué salió mal con la respuesta.
2. Categorizar sus notas
Después de haber revisado un buen conjunto de respuestas, tome un LLM y pídale que encuentre patrones comunes en sus notas. Pídale que clasifique cada nota según estos patrones.
Terminará con categorías que cubren cada tipo de error que cometió su aplicación.
3. Diagnosticar los errores más frecuentes
Comience enfocándose en el tipo de error más común. No quiere perder tiempo trabajando con errores raros.
Profundice en las conversaciones, entradas y registros que llevaron a esas muestras incorrectas. Intente entender qué podría estar causando los problemas.
4. Diseñar soluciones específicas
En este punto, desea determinar cómo eliminar los errores que diagnosticó en el paso anterior de la manera más rápida y económica posible.
Por ejemplo, podría ajustar sus indicaciones, agregar reglas de validación adicionales, encontrar más datos de entrenamiento o modificar el modelo.
5. Automatizar el proceso de evaluación
Necesita implementar un proceso simple para volver a ejecutar un conjunto de evaluación a través de su aplicación y evaluar si sus soluciones fueron efectivas.
Mi recomendación es usar un LLM como Juez para ejecutar muestras a través de la aplicación, puntuarlas con una etiqueta de APROBADO/REPROBADO y calcular los resultados.
6. Mantener un ojo en sus métricas
Cada categoría que identificó durante el análisis de errores es una métrica que desea rastrear a lo largo del tiempo.
No llegará a ninguna parte obsesionándose con "relevancia", "corrección", "completitud", "coherencia" y cualquier otra métrica estándar. Olvídese de estas y concéntrese en los problemas reales que encontró.

49,29K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado