Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Princeton CS prof. Director @PrincetonCITP. Folosesc X pentru a-mi împărtăși cercetările și comentariile despre impactul social al AI.
CARTE: AI Snake Oil. Vizualizările mele.
Experiența mea cu ChatGPT Agent până acum: Nu am reușit să găsesc niciun caz de utilizare care nu poate fi gestionat de Deep Research și totuși poate fi finalizat cu succes de Agent fără a întâmpina obstacole precum formulare web ciudate sau restricții de acces.
Sunt sigur că voi găsi unele utilizări, dar va ajunge să fie o mică parte din sarcinile care apar în fluxurile mele de lucru.
Dacă acesta este cazul, nu va avea sens să încerc să fac sarcini noi folosind Agent, cu excepția cazului în care altfel aș petrece ore întregi (sau ar trebui să repet zilnic). Dacă mă aștept ca Agent să reușească cu o probabilitate de 5% și să dureze 10-20 de minute de încercare dureroasă înainte de a renunța, nu merită să aflu dacă Agent poate face acest lucru. L-aș folosi doar dacă aș ști deja că este o sarcină pe care Agent o poate gestiona.
Având în vedere toate acestea, continui să cred că agenții specifici sarcinilor vor avea mai mult succes în viitorul apropiat.
7,78K
Arvind Narayanan a repostat
🧠Nou pe blogul CITP de la doctorandul Boyi Wei (@wei_boyi) de la laboratorul POLARIS: "'Bula' de risc: îmbunătățirea evaluărilor pentru agenții ofensivi de securitate cibernetică"
Citiți despre modul în care adversarii pot adapta și modifica modelele open-source pentru a ocoli măsurile de protecție. 👇
3,12K
În școala postuniversitară, când mi-am dat seama cum funcționează de fapt "piața ideilor", am simțit că am găsit codurile de trișare pentru o carieră de cercetare. Astăzi, acestea sunt cele mai importante lucruri pe care le predau studenților, mai mult decât orice altceva legat de substanța cercetării noastre.
O scurtă prefață: când vorbesc despre succesul cercetării nu mă refer la publicarea multor lucrări. Majoritatea lucrărilor publicate adună praf pentru că există prea multe cercetări în orice domeniu pentru ca oamenii să le acorde atenție. Și mai ales având în vedere ușurința de a publica pre-printuri, cercetarea nu trebuie publicată oficial pentru a avea succes. Deci, deși publicațiile pot fi o condiție prealabilă pentru avansarea în carieră, ele nu ar trebui să fie scopul. Pentru mine, succesul cercetării este autorul ideilor care îi influențează pe colegii tăi și fac lumea un loc mai bun.
Deci ideea de bază este că există prea multe idei care intră pe piața ideilor și trebuie să înțelegem care dintre ele ajung să fie influente. Vestea bună este că calitatea contează – celelalte lucruri fiind egale, o cercetare mai bună va avea mai mult succes. Vestea proastă este că calitatea este doar slab corelată cu succesul și există mulți alți factori care contează.
În primul rând, dă-ți mai multe șuturi pe poartă. Rolul norocului este o temă obișnuită a sfaturilor mele de carieră. Este adevărat că norocul contează foarte mult în a determina ce lucrări au succes, dar asta nu înseamnă să te resemnezi cu el. Vă puteți crește "suprafața norocului".
De exemplu, dacă publici întotdeauna preprinturi, ai mai multe șanse ca munca ta să fie remarcată: o dată cu preprintul și o dată cu publicarea (în plus, dacă ești într-un domeniu cu întârzieri mari de publicare, te poți asigura că cercetarea nu este scoop sau irelevantă până când apare).
În general, tratați proiectele de cercetare ca pe startup-uri – acceptați că există o variație foarte mare a rezultatelor, unele proiecte având de 10 sau 100 de ori mai mult succes decât altele. Asta înseamnă să încerci o mulțime de lucruri diferite, să faci schimbări mari, să fii dispus să urmărești ceea ce colegii tăi consideră a fi idei proaste, dar cu o idee despre motivul pentru care ai putea reuși acolo unde alții înainte de tine au eșuat. Știi ceva ce alții nu știu sau ei știu ceva ce tu nu știi? Și dacă afli că este a doua variantă, trebuie să fii dispus să renunți rapid la proiect, fără a cădea pradă erorilor costurilor irecuperabile.
Pentru a fi clar, succesul nu se datorează norocului - calitatea și profunzimea contează foarte mult. Și este nevoie de câțiva ani de cercetare pentru a aprofunda un subiect. Dar petrecerea câtorva ani cercetând un subiect înainte de a publica ceva este extrem de riscantă, mai ales la începutul carierei tale. Soluția este simplă: urmăriți proiecte, nu probleme.
Proiectele sunt agende de cercetare pe termen lung care durează 3-5 ani sau mai mult. Un proiect productiv ar putea produce cu ușurință o duzină sau mai multe lucrări (în funcție de domeniu). De ce să alegi proiecte în loc de probleme? Dacă metoda ta este să sari de la o problemă la alta, lucrările rezultate sunt probabil să fie oarecum superficiale și s-ar putea să nu aibă prea mult impact. Și în al doilea rând, dacă ești deja cunoscut pentru lucrări pe un anumit subiect, oamenii sunt mai predispuși să acorde atenție viitoarelor tale lucrări pe acel subiect. (Da, reputația autorului contează foarte mult. Orice noțiune egalitaristă despre cum aleg oamenii ce să citească este un mit.)
Pentru a recapitula, de obicei lucrez la 2-3 proiecte pe termen lung la un moment dat, iar în cadrul fiecărui proiect sunt multe probleme investigate și multe lucrări sunt produse în diferite etape ale conductei.
Cea mai grea parte este să știi când să închei un proiect. În momentul în care te gândești la un nou proiect, compari ceva care va dura câțiva ani pentru a se concretiza cu un subiect în care ești deja foarte productiv. Dar trebuie să închei ceva pentru a face loc pentru ceva nou. Renunțarea la momentul potrivit se simte întotdeauna ca și cum ai renunța prea devreme. Dacă mergeți cu instinctul, veți rămâne în aceeași zonă de cercetare mult prea mult timp.
În cele din urmă, construiește-ți propria distribuție. În trecut, publicarea oficială a unei lucrări avea două scopuri: să-i ofere credibilitatea care vine din evaluarea inter pares și să distribuie lucrarea colegilor. Acum aceste două funcții au fost complet întrerupte. Publicarea aduce în continuare credibilitate, dar distribuția depinde aproape în întregime de tine!
Acesta este motivul pentru care social media contează atât de mult. Din păcate, rețelele sociale introduc stimulente nesănătoase pentru a exagera constatările, așa că consider că blogurile/buletinele informative și videoclipurile de lungă durată sunt canale mult mai bune. Suntem într-o a doua epocă de aur a blogging-ului și există o lipsă extremă de oameni care pot explica cercetările de ultimă oră din disciplinele lor într-un mod accesibil, dar fără a le prostește, ca în comunicatele de presă sau articolele de știri. Nu este niciodată prea devreme – am început un blog în timpul doctoratului și a jucat un rol important în răspândirea cercetării mele doctorale, atât în cadrul comunității mele de cercetare, cât și în afara ei.
Rezumat
* Succesul cercetării nu înseamnă doar publicare
* Piața ideilor este saturată
* Oferă-ți mai multe șuturi pe poartă
* Alegeți proiecte, nu probleme
* Tratați proiectele ca pe startup-uri
* Construiește-ți propria distribuție
44,23K
Arvind Narayanan a repostat
Experții în tulburarea dismorfică corporală au avertizat că persoanele care se luptă cu aceasta au devenit din ce în ce mai dependente de chatbot-urile AI pentru a-și evalua defectele autopercepute și pentru a recomanda intervenții chirurgicale estetice. "Aproape că apare în fiecare sesiune", îmi spune un terapeut.

106,85K
Dacă am compara capacitățile AI cu cele ale oamenilor fără acces la instrumente, cum ar fi internetul, am descoperi probabil că AI a depășit deja oamenii la multe sau la majoritatea sarcinilor cognitive pe care le îndeplinim la locul de muncă. Dar, desigur, aceasta nu este o comparație utilă și nu ne spune prea multe despre impactul economic al AI. Nu suntem nimic fără instrumentele noastre.
Și totuși, multe predicții despre impactul "AGI" se bazează pe comparații ipotetice om-AI în care oamenii au acces la internet, dar nu acces la AI. Acest tip de comparație este la fel de irelevant.
Adevărata întrebare este oamenii + AI vs AI singuri. Într-o astfel de comparație, AI nu va depăși perechile om-AI, cu excepția domeniilor înguste, grele din punct de vedere computațional, cum ar fi jocurile în care viteza este primordială și a avea un om în imagine nu face decât să încetinească lucrurile.
Deci, dacă AI va înlocui sau nu oamenii se reduce la factori dincolo de acuratețe – lucruri precum responsabilitatea, capacitatea de a gestiona necunoscute necunoscute și potențialele preferințe ale clienților și ale altor lucrători de a interacționa cu un om, toate cântărite în raport cu costul angajării unui om.
Asta nu înseamnă că AI nu va înlocui locurile de muncă. Dar să te uiți la reperele de capacitate și să mergi direct la afirmațiile despre pierderea locurilor de muncă este complet naiv.
Există multe studii în care lucrătorii suprascriu incorect AI prea des, dar asta pentru că nu au primit nicio instruire cu privire la când să suprascrie și când nu, ceea ce este o abilitate esențială în fluxurile de lucru bazate pe AI.
12,67K
Arvind Narayanan a repostat
SB1047 a fost o idee proastă. Dar cel mai recent SB53 al senatorului Wiener este pe drumul cel bun și este important să subliniem progresul. Iată raționamentul meu.
Abordarea mea pentru reglementarea noilor tehnologii precum modelele este: nu știm cum să definim atenuarea și asigurarea "bună", dar o vom ști când – și dacă – o vom vedea.
Există două implicații.
#1. Nu ar trebui să prescriem praguri de risc sau standarde de îngrijire pentru dezvoltarea modelelor. Nu putem fi de acord asupra riscurilor care contează, cum să le măsurăm sau cât de mult este prea mult. Singurele îndrumări pentru dezvoltatori, autorități de reglementare și instanțe sunt un set de practici incipiente determinate în primul rând de firmele cu sursă închisă care se bazează pe paywall-uri pentru a face munca grea. Acest lucru ar putea răci inovația deschisă prin expunerea dezvoltatorilor la o răspundere vagă sau sporită pentru lansarea pe scară largă.
Acesta a fost SB1047 pe scurt, împreună cu ~5 echivalente pe care le-a inspirat în SUA în această sesiune, cum ar fi Legea RAISE din New York. Ar trebui să evităm această abordare. Aceste propuneri sunt – în privințe înguste, dar cruciale – prea departe peste schiurile lor.
Și totuși:
#2. Trebuie să facem lumină asupra practicilor industriei pentru a înțelege mai bine diligența sau lipsa acesteia aplicată de diferite firme. Dacă dezvoltatorii trebuie să se angajeze într-o politică de siguranță și securitate, să-și arate activitatea și să lase o urmă de hârtie, putem evalua mai bine puterea revendicărilor lor, putem monitoriza riscurile emergente și putem decide asupra intervențiilor viitoare.
Acesta este pe scurt Legea UE privind IA și Codul final de practică, pe care atât OpenAI, cât și Mistral l-au susținut, și este și cea mai recentă versiune a SB53 a lui @Scott_Wiener.
Dacă vom reglementa dezvoltarea modelelor, aceasta este în mod fundamental cea mai bună abordare: reglementarea transparenței – nu a capabilităților, atenuărilor sau riscurilor acceptabile. Ar oferi cel puțin unei jurisdicții americane autoritatea de supraveghere a Bruxelles-ului și ar evita efectele neintenționate asupra dezvoltării deschise.
Pentru a fi clar, mai sunt încă aisberguri în față:
> Complexitate. Big Tech sau nu, acestea sunt obligații oneroase de documentare și raportare. Tactic vorbind, cu cât este mai complex, cu atât mai vulnerabil va deveni acest proiect de lege.
> Stimulente. Raportarea publică obligatorie a evaluărilor voluntare ale riscurilor creează un stimulent pervers pentru dezvoltatori să-și testeze modelele și să închidă ochii la riscurile dificile. Permiterea dezvoltatorilor să-și dezvăluie rezultatele auditorilor sau agențiilor, mai degrabă decât publicului, poate ajuta la promovarea unei mai mari sincerități în evaluările lor interne.
> cal troian. Cultura hiperactivă a Californiei poate face dificilă verificarea acestor proiecte de lege. Dacă SB53 se transformă într-un proiect de lege standard de îngrijire precum SB1047 sau RAISE, ar trebui să fie respins din aceleași motive ca înainte. Cu cât se adaugă mai multe globuri la acest pom de Crăciun, cu atât proiectul de lege este mai controversat.
> lățime. Proiectul de lege aruncă o plasă largă cu definiții extinse ale riscului catastrofal și capacității periculoase. Pentru un proiect de lege privind "raportarea obligatorie / practicile voluntare", ele funcționează. Dacă acest proiect de lege ar fi un proiect de lege privind standardul de îngrijire, ar fi nefezabil.
În concluzie: jos pălăria în fața senatorului Wiener pentru implicarea atentă și răspunsul la feedback din ultimul an. Este revigorant să vezi un proiect de lege care se bazează de fapt pe criticile anterioare. Există încă multe căi pe care acest proiect de lege le-ar putea lua – și a evoluat cu mult dincolo de propunerea inițială de avertizare – dar traiectoria este promițătoare.

6K
Arvind Narayanan a repostat
Pentru cei care se întreabă ce se întâmplă aici din punct de vedere tehnic, o explicație:
Când există o mulțime de date de antrenament cu un anumit stil, utilizarea unui stil similar în solicitare va declanșa LLM să răspundă în acel stil. În acest caz, există o mulțime de fanfic-uri:
🧵
180,28K
Arvind Narayanan a repostat
Postare nouă: Iluzii ale centrelor de date
Dintre puterile mijlocii, Emiratele Arabe Unite au cea mai clară strategie AI: să devină un "stat petrolier AI" cu o cotă semnificativă de calcul globală. Majoritatea celorlalte țări construiesc centre de date fără a viza praguri viabile de suveranitate.
🧵

10,03K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante