Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Am fost unul dintre cei 16 dezvoltatori din acest studiu. Am vrut să vorbesc despre opiniile mele despre cauzele și strategiile de atenuare a încetinirii dezvoltării.
Voi spune ca un cârlig "de ce să te ascult?" că am experimentat o accelerare AI de -38% la problemele mele atribuite. Cred că transparența ajută comunitatea.


11 iul., 01:23
Am efectuat un studiu controlat randomizat pentru a vedea cât de mult instrumentele de codare AI accelerează dezvoltatorii open-source cu experiență.
Rezultatele ne-au surprins: dezvoltatorii au crezut că sunt cu 20% mai rapizi cu instrumentele AI, dar de fapt au fost cu 19% mai lenți atunci când au avut acces la AI decât atunci când nu au avut.

În primul rând, cred că accelerarea AI este foarte slab corelată cu abilitățile oricui ca dezvoltator. Toți dezvoltatorii din acest studiu sunt foarte buni. Cred că are mai mult de-a face cu căderea în moduri de eșec, atât în capacitatea LLM, cât și în fluxul de lucru al omului. Lucrez cu o mulțime de dezvoltatori uimitori de pretraining și cred că oamenii se confruntă cu multe dintre aceleași probleme.
Ne place să spunem că LLM-urile sunt instrumente, dar le tratăm mai mult ca pe un glonț magic.
Literalmente, orice dezvoltator poate atesta satisfacția de a depana în sfârșit o problemă spinoasă. LLM-urile sunt un buton mare de comandă rapidă cu dopamină care vă poate rezolva problema. Continui să apeși butonul care are o șansă de 1% să repari totul? Este mult mai plăcut decât alternativa istovitoare, cel puțin pentru mine.
Cred că cazurile de utilizare excesivă a LLM se pot întâmpla pentru că este ușor de optimizat pentru plăcerea percepută, mai degrabă decât timpul de rezolvare în timp ce lucrați.
Eu apăs tab în cursor timp de 5 ore în loc de depanare timp de 1:
În al treilea rând, este foarte ușor să fii distras în timpul de nefuncționare în timp ce LLM-urile generează. Economia atenției pe rețelele de socializare este brutală și cred că oamenii petrec 30 de minute derulând în timp ce "așteaptă" generația lor de 30 de secunde.
Tot ce pot spune este că ar trebui să ne cunoaștem propriile capcane și să încercăm să umplem acest timp de generație LLM în mod productiv:
- Dacă sarcina necesită o concentrare ridicată, petreceți acest timp fie lucrând la o sarcină secundară, fie gândindu-vă la întrebări ulterioare. Chiar dacă modelul îți răspunde la întrebare, ce altceva nu înțeleg?
- Dacă sarcina necesită o concentrare scăzută, faceți o altă sarcină mică între timp (răspundeți la e-mail/slack, citiți sau editați un alt paragraf etc.).
Ca întotdeauna, mici pași de igienă digitală ajută în acest sens (blocatoare de site-uri web, telefon pe dnd etc.). Îmi pare rău că sunt bunică, dar funcționează pentru mine :)
Câteva declarații finale:
- METR este o organizație minunată cu care să lucrezi și sunt oameni de știință puternici. Mi-a plăcut atât să particip la acest studiu, cât și să le citesc rezultatele.
- Nu sunt un guru LLM care încearcă să predice. Gândiți-vă la asta ca la publicarea unei intrări personale în jurnal și sperând că alții pot beneficia de introspecția mea.
1,72M
Limită superioară
Clasament
Favorite