Încă sunt dezamăgit de starea agenților locali de programare. Am plătit o sumă considerabilă pentru suficient hardware să ruleze qwen3.5:122b @ q4, qwen3.5:35b @ q8 și qwen3-coder:30b @ q8. Niciunul dintre ei nu poate face cu succes ceea ce ar trebui să fie o refactorizare complet mecanică a TypeScript. Mai jos.
Am furnizat diferențe de exemplu din fișiere deja refactorizate, sunt explicit în privința a ceea ce trebuie făcut ("adaugă un argument de acest tip la funcțiile care returnează acest tip"), am oferit auto-verificare a erorilor de imprimare a scripturilor și filtrarea zgomotului din fișierele încă nefactorizate pentru a evita distragerile.
Ce se întâmplă în practică: Ei produc cod parțial care generează erori noi (importuri nefolosite), adaugă cod nou care nu trece verificările de sintaxă, se lasă distrași de propriile erori auto-introduse, apelează funcții (definite în același fișier) cu argumente care nu există, se blochează și se repetă.
Acum am petrecut mai mult timp încercând să fac asta să funcționeze decât mi-ar fi luat singur, de mai multe ori. A mai avut cineva o experiență similară? Cum faci să funcționeze mai fiabil?
Tot nu vreau să-i ofer lui Anthropic sau uriașului tehnologic inserat aici informațiile mele personale. Și chiar și cu ceva precum @AskVenice sau OpenRouter în cale, Cline scurge multe informații de sistem chiar în prompt.
56