Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Princeton CS prof. Dyrektor @PrincetonCITP. Używam X, aby dzielić się moimi badaniami i komentarzami na temat społecznego wpływu sztucznej inteligencji.
KSIĄŻKA: Olej z węża AI. Widoki moje.
Moje doświadczenia z ChatGPT Agent do tej pory: Nie udało mi się znaleźć żadnych przypadków użycia, które _nie_ mogłyby być obsługiwane przez Deep Research, a które mogłyby być pomyślnie zrealizowane przez Agenta bez napotkania jakichkolwiek przeszkód, takich jak nieczytelne formularze internetowe czy ograniczenia dostępu.
Jestem pewien, że znajdę jakieś zastosowania, ale będzie to tylko mała część zadań, które pojawiają się w moich procesach roboczych.
Jeśli tak jest, nie ma sensu próbować wykonywać nowych zadań za pomocą Agenta, chyba że jest to zadanie, które w przeciwnym razie zajmie mi godziny (lub które musiałbym powtarzać codziennie). Jeśli moje oczekiwanie jest takie, że Agent odniesie sukces z prawdopodobieństwem 5%, a próba zajmuje 10-20 minut intensywnego wysiłku przed poddaniem się, to nie warto nawet sprawdzać, czy Agent może to zrobić. Użyłbym go tylko wtedy, gdybym w jakiś sposób już wiedział, że to zadanie, które Agent może obsłużyć.
Biorąc to wszystko pod uwagę, nadal uważam, że agenci specyficzni dla zadań będą bardziej skuteczni w przewidywalnej przyszłości.
2,79K
Użytkownik Arvind Narayanan udostępnił ponownie
🧠Nowość na blogu CITP od studenta doktoranckiego Boyi Wei (@wei_boyi) z laboratorium POLARIS: "'Bańka' ryzyka: Udoskonalanie ocen dla ofensywnych agentów cyberbezpieczeństwa"
Przeczytaj, jak przeciwnicy mogą dostosowywać i modyfikować modele open-source, aby ominąć zabezpieczenia. 👇
2,97K
Wracając do czasów studiów magisterskich, kiedy zrozumiałem, jak naprawdę działa „rynek pomysłów”, poczułem, że znalazłem kody do oszukiwania w karierze badawczej. Dziś to jest najważniejsza rzecz, którą uczę studentów, bardziej niż cokolwiek związanego z treścią naszych badań.
Krótki wstęp: kiedy mówię o sukcesie w badaniach, nie mam na myśli publikowania wielu artykułów. Większość opublikowanych prac zbiera kurz, ponieważ w każdej dziedzinie jest zbyt wiele badań, aby ludzie mogli na nie zwrócić uwagę. A zwłaszcza biorąc pod uwagę łatwość publikowania preprintów, badania nie muszą być oficjalnie opublikowane, aby odniosły sukces. Więc chociaż publikacje mogą być warunkiem awansu zawodowego, nie powinny być celem. Dla mnie sukces w badaniach to autorstwo pomysłów, które wpływają na twoich rówieśników i sprawiają, że świat staje się lepszym miejscem.
Podstawowy wniosek jest taki, że na rynek pomysłów wchodzi zbyt wiele idei i musimy zrozumieć, które z nich stają się wpływowe. Dobrą wiadomością jest to, że jakość ma znaczenie — przy równych innych warunkach, lepsze badania będą bardziej udane. Złą wiadomością jest to, że jakość jest tylko słabo skorelowana z sukcesem, a wiele innych czynników ma znaczenie.
Po pierwsze, daj sobie wiele szans na sukces. Rola szczęścia jest regularnym tematem moich porad zawodowych. To prawda, że szczęście ma duże znaczenie w określaniu, które artykuły odnoszą sukces, ale to nie oznacza, że należy się temu poddawać. Możesz zwiększyć swoją „powierzchnię szczęścia”.
Na przykład, jeśli zawsze publikujesz preprinty, masz wiele szans na to, aby twoja praca została zauważona: raz z preprintem i raz z publikacją (plus jeśli jesteś w dziedzinie z dużymi opóźnieniami w publikacjach, możesz upewnić się, że badania nie zostaną przejęte lub nie będą nieistotne, gdy się ukażą).
Ogólnie rzecz biorąc, traktuj projekty badawcze jak startupy — zaakceptuj, że istnieje bardzo duża zmienność wyników, a niektóre projekty mogą być 10x lub 100x bardziej udane niż inne. Oznacza to próbowanie wielu różnych rzeczy, podejmowanie dużych ryzyk, gotowość do realizacji tego, co twoi rówieśnicy uważają za złe pomysły, ale z pewnym pomysłem na to, dlaczego możesz potencjalnie odnieść sukces tam, gdzie inni przed tobą ponieśli porażkę. Czy wiesz coś, czego inni nie wiedzą, czy oni wiedzą coś, czego ty nie wiesz? A jeśli odkryjesz, że to drugie, musisz być gotów szybko zrezygnować z projektu, nie dając się wciągnąć w pułapkę kosztów utopionych.
Aby było jasne, sukces nie zależy tylko od szczęścia — jakość i głębokość mają ogromne znaczenie. I potrzeba kilku lat badań, aby zgłębić temat. Ale spędzenie kilku lat na badaniu tematu przed opublikowaniem czegokolwiek jest niezwykle ryzykowne, zwłaszcza na początku kariery. Rozwiązanie jest proste: realizuj projekty, a nie problemy.
Projekty to długoterminowe agendy badawcze, które trwają 3-5 lat lub dłużej. Produktywny projekt mógłby łatwo przynieść tuzin lub więcej artykułów (w zależności od dziedziny). Dlaczego wybierać projekty zamiast problemów? Jeśli twoją metodą jest skakanie z problemu na problem, powstałe artykuły prawdopodobnie będą dość powierzchowne i mogą nie mieć dużego wpływu. Po drugie, jeśli już jesteś znany z artykułów na dany temat, ludzie będą bardziej skłonni zwracać uwagę na twoje przyszłe artykuły na ten temat. (Tak, reputacja autora ma ogromne znaczenie. Każda egalitarna koncepcja tego, jak ludzie wybierają, co czytać, to mit.)
Podsumowując, zazwyczaj pracuję nad 2-3 długoterminowymi projektami jednocześnie, a w ramach każdego projektu badane są różne problemy i powstaje wiele artykułów na różnych etapach realizacji.
Najtrudniejszą częścią jest wiedzieć, kiedy zakończyć projekt. W momencie, gdy rozważasz nowy projekt, porównujesz coś, co zajmie kilka lat, aby naprawdę przynieść owoce, z tematem, w którym już jesteś bardzo produktywny. Ale musisz zakończyć coś, aby zrobić miejsce na coś nowego. Rezygnacja w odpowiednim momencie zawsze wydaje się zbyt wczesna. Jeśli pójdziesz za swoim instynktem, pozostaniesz w tej samej dziedzinie badań zbyt długo.
Na koniec, zbuduj swoją własną dystrybucję. W przeszłości oficjalna publikacja artykułu miała dwa cele: nadanie mu wiarygodności, która wynika z recenzji przez rówieśników, oraz dystrybucję artykułu do twoich rówieśników. Teraz te dwie funkcje zostały całkowicie rozdzielone. Publikacja nadal przynosi wiarygodność, ale dystrybucja jest niemal całkowicie w twoich rękach!
Dlatego media społecznościowe mają tak duże znaczenie. Niestety media społecznościowe wprowadzają niezdrowe zachęty do przesadzania z wynikami, więc uważam, że blogi/biuletyny i długie filmy są znacznie lepszymi kanałami. Jesteśmy w drugiej złotej erze blogowania i brakuje ludzi, którzy potrafią w przystępny sposób wyjaśnić nowatorskie badania ze swoich dziedzin, ale bez upraszczania ich jak w komunikatach prasowych czy artykułach prasowych. Nigdy nie jest za wcześnie — założyłem bloga podczas moich studiów doktoranckich i odegrał on dużą rolę w rozpowszechnianiu moich badań doktoranckich, zarówno w mojej społeczności badawczej, jak i poza nią.
Podsumowanie
* Sukces w badaniach nie oznacza tylko publikacji
* Rynek pomysłów jest nasycony
* Daj sobie wiele szans na sukces
* Wybieraj projekty, a nie problemy
* Traktuj projekty jak startupy
* Zbuduj swoją własną dystrybucję.
39,61K
Użytkownik Arvind Narayanan udostępnił ponownie
Eksperci w dziedzinie zaburzeń dysmorficznych ciała ostrzegają, że osoby zmagające się z tym problemem stają się coraz bardziej zależne od chatbotów AI, aby oceniać swoje postrzegane wady i rekomendować operacje kosmetyczne. "To prawie pojawia się w każdej sesji," mówi mi jeden terapeuta.

106,83K
Jeśli porównamy możliwości AI z ludźmi, którzy nie mają dostępu do narzędzi, takich jak internet, prawdopodobnie stwierdzimy, że AI już przewyższa ludzi w wielu lub większości zadań poznawczych, które wykonujemy w pracy. Ale oczywiście to nie jest pomocne porównanie i nie mówi nam wiele o ekonomicznych skutkach AI. Jesteśmy niczym bez naszych narzędzi.
A jednak wiele prognoz dotyczących wpływu "AGI" opiera się na hipotetycznych porównaniach ludzi i AI, w których ludzie mają dostęp do internetu, ale nie mają dostępu do AI. Tego rodzaju porównanie jest równie nieistotne.
Prawdziwe pytanie brzmi: ludzie + AI vs AI samodzielnie. W takim porównaniu AI nie przewyższy par ludzkich i AI, z wyjątkiem wąskich, obliczeniowo intensywnych dziedzin, takich jak gry, gdzie prędkość ma kluczowe znaczenie, a obecność człowieka tylko spowalnia procesy.*
Zatem to, czy AI zastąpi ludzi, sprowadza się do czynników wykraczających poza dokładność — takich jak odpowiedzialność, zdolność do radzenia sobie z nieznanymi nieznanymi oraz potencjalne preferencje klientów i innych pracowników do interakcji z człowiekiem, wszystko to w porównaniu z kosztami zatrudnienia człowieka.
Nie oznacza to, że AI nie zlikwiduje miejsc pracy. Ale patrzenie na benchmarki możliwości i przechodzenie od razu do twierdzeń o utracie pracy jest całkowicie naiwne.
* Istnieje wiele badań, w których pracownicy zbyt często błędnie ignorują AI, ale to dlatego, że nie przeszli szkolenia, kiedy należy ignorować, a kiedy nie, co jest niezbędną umiejętnością w procesach pracy z AI.
12,62K
Użytkownik Arvind Narayanan udostępnił ponownie
SB1047 był złym pomysłem. Ale najnowsze SB53 senatora Wienera jest na właściwej drodze i ważne jest, aby docenić postęp. Oto moje uzasadnienie.
Moje podejście do regulacji nowej technologii, takiej jak modele, jest takie: nie wiemy, jak zdefiniować "dobre" łagodzenie i zapewnienie, ale poznamy to, gdy - i jeśli - to zobaczymy.
Są dwie implikacje.
#1. Nie powinniśmy określać progów ryzyka ani standardów opieki dla rozwoju modeli. Nie możemy się zgodzić co do ryzyk, które mają znaczenie, jak je mierzyć ani jak dużo jest za dużo. Jedynym przewodnikiem dla deweloperów, regulatorów i sądów jest zestaw wczesnych praktyk określonych głównie przez firmy z zamkniętym kodem, które polegają na płatnych ścianach, aby wykonać ciężką pracę. Robienie tego mogłoby schłodzić otwartą innowację, narażając deweloperów na niejasną lub zwiększoną odpowiedzialność za szerokie wydanie.
To było SB1047 w pigułce, wraz z ~5 równoważnymi, które zainspirowało w całych Stanach Zjednoczonych w tej sesji, takimi jak ustawa RAISE w NY. Powinniśmy unikać tego podejścia. Te propozycje są - w wąskich, ale kluczowych aspektach - zbyt daleko wykraczające poza to, co jest rozsądne.
A jednak:
#2. Musimy rzucić światło na praktyki branżowe, aby lepiej zrozumieć staranność, lub jej brak, stosowaną przez różne firmy. Jeśli deweloperzy muszą zobowiązać się do polityki bezpieczeństwa i ochrony, pokazać swoje działania i zostawić ślad papierowy, możemy lepiej ocenić siłę ich roszczeń, monitorować pojawiające się ryzyko i zdecydować o przyszłej interwencji.
To jest w skrócie akt AI UE i ostateczny kodeks praktyki, które zarówno OpenAI, jak i Mistral poparły, a także najnowsza wersja SB53 senatora @Scott_Wienera.
Jeśli zamierzamy regulować rozwój modeli, to zasadniczo lepsze podejście: regulowanie przejrzystości - a nie możliwości, łagodzeń czy akceptowalnego ryzyka. Daje to przynajmniej jednej jurysdykcji w USA władzę nadzoru Brukseli i unika niezamierzonych skutków dla otwartego rozwoju.
Aby było jasne, wciąż są góry lodowe przed nami:
> Złożoność. Niezależnie od tego, czy to Big Tech, czy nie, są to uciążliwe obowiązki dokumentacyjne i raportowe. Taktycznie mówiąc, im bardziej złożone, tym bardziej wrażliwy ten projekt ustawy stanie się.
> Zachęty. Obowiązkowe publiczne raportowanie dobrowolnych ocen ryzyka tworzy perwersyjną zachętę dla deweloperów do niedostatecznego testowania swoich modeli i ignorowania trudnych ryzyk. Zezwolenie deweloperom na ujawnianie swoich wyników audytorom lub agencjom zamiast publicznie może pomóc w promowaniu większej szczerości w ich wewnętrznych ocenach.
> Koń trojański. Hiperaktywna kultura „wycinania i poprawiania” w Kalifornii może utrudniać weryfikację tych ustaw. Jeśli SB53 przekształci się w ustawę o standardzie opieki, taką jak SB1047 lub RAISE, powinna zostać odrzucona z tych samych powodów, co wcześniej. Im więcej ozdób dodaje się do tej choinki bożonarodzeniowej, tym bardziej kontrowersyjny staje się projekt ustawy.
> Zakres. Ustawa rzuca szeroką sieć z rozbudowanymi definicjami ryzyka katastrofalnego i niebezpiecznej zdolności. Dla ustawy o "obowiązkowym raportowaniu / dobrowolnych praktykach" działają. Gdyby ta ustawa była ustawą o standardzie opieki, byłyby niewykonalne.
Podsumowując: chwała senatorowi Wienerowi za przemyślane zaangażowanie i odpowiedź na opinie w ciągu ostatniego roku. To odświeżające widzieć ustawę, która rzeczywiście opiera się na wcześniejszej krytyce. Wciąż jest wiele ścieżek, którymi ta ustawa może podążać - i ewoluowała daleko poza pierwotną propozycję ujawnienia - ale trajektoria jest obiecująca.

5,97K
Użytkownik Arvind Narayanan udostępnił ponownie
Dla osób zastanawiających się, co się tutaj dzieje technicznie, wyjaśnienie:
Kiedy jest dużo danych treningowych w określonym stylu, użycie podobnego stylu w swoim zapytaniu spowoduje, że LLM odpowie w tym stylu. W tym przypadku jest mnóstwo fanfiku:
🧵
180,24K
Użytkownik Arvind Narayanan udostępnił ponownie
Nowy post: Iluzje centrów danych
Wśród średnich mocarstw ZEA ma najjaśniejszą strategię AI: stać się 'państwem naftowym AI' z istotnym globalnym udziałem w obliczeniach. Większość innych krajów buduje centra danych, nie celując w realne progi suwerenności.
🧵

10,01K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi