Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Arvind Narayanan
Giáo sư Princeton CS Giám đốc @PrincetonCITP. Tôi sử dụng X để chia sẻ nghiên cứu và bình luận của mình về tác động xã hội của AI.
SÁCH: Dầu rắn AI. Quan điểm của tôi.
Kinh nghiệm của tôi với ChatGPT Agent cho đến nay: Tôi đã không tìm thấy bất kỳ trường hợp sử dụng nào mà _không_ thể được xử lý bởi Deep Research và vẫn có thể được hoàn thành thành công bởi Agent mà không gặp phải bất kỳ trở ngại nào như các biểu mẫu web không ổn định hoặc hạn chế truy cập.
Tôi chắc chắn sẽ tìm thấy một số cách sử dụng, nhưng nó sẽ chỉ chiếm một phần nhỏ trong các nhiệm vụ xuất hiện trong quy trình làm việc của tôi.
Nếu đúng như vậy, sẽ không hợp lý khi cố gắng thực hiện các nhiệm vụ mới bằng cách sử dụng Agent trừ khi đó là một nhiệm vụ mà tôi sẽ phải dành hàng giờ để thực hiện (hoặc sẽ cần phải lặp lại hàng ngày). Nếu kỳ vọng của tôi là Agent sẽ thành công với xác suất 5%, và nó mất 10-20 phút cố gắng rất khó khăn trước khi từ bỏ, thì không đáng để tôi dành thời gian để tìm hiểu xem Agent có thể làm được hay không. Tôi chỉ sử dụng nó nếu tôi đã biết rằng đó là một nhiệm vụ mà Agent có thể xử lý.
Với tất cả những điều này, tôi vẫn tiếp tục nghĩ rằng các tác nhân cụ thể cho nhiệm vụ sẽ thành công hơn trong tương lai gần.
3,96K
Arvind Narayanan đã đăng lại
🧠Mới trên Blog CITP từ sinh viên Tiến sĩ Boyi Wei (@wei_boyi) của Phòng thí nghiệm POLARIS: "Bong bóng" của Rủi ro: Cải thiện Đánh giá cho Các tác nhân An ninh mạng tấn công"
Đọc về cách mà kẻ thù có thể thích ứng và điều chỉnh các mô hình mã nguồn mở để vượt qua các biện pháp bảo vệ. 👇
2,97K
Trở lại thời gian học cao học, khi tôi nhận ra cách mà "thị trường ý tưởng" thực sự hoạt động, tôi cảm thấy như mình đã tìm thấy mã gian lận cho sự nghiệp nghiên cứu. Hôm nay, đây là những điều quan trọng nhất mà tôi dạy cho sinh viên, hơn bất cứ điều gì liên quan đến nội dung nghiên cứu của chúng tôi.
Một lời mở đầu nhanh: khi tôi nói về thành công trong nghiên cứu, tôi không có ý nghĩa là xuất bản nhiều bài báo. Hầu hết các bài báo đã xuất bản đều bị bỏ quên vì có quá nhiều nghiên cứu trong bất kỳ lĩnh vực nào để mọi người chú ý đến. Và đặc biệt là với sự dễ dàng trong việc phát hành các bản thảo trước, nghiên cứu không cần phải được xuất bản chính thức để thành công. Vì vậy, trong khi việc xuất bản có thể là điều kiện tiên quyết cho sự thăng tiến trong sự nghiệp, chúng không nên là mục tiêu. Đối với tôi, thành công trong nghiên cứu là việc làm tác giả của những ý tưởng ảnh hưởng đến đồng nghiệp của bạn và làm cho thế giới trở nên tốt đẹp hơn.
Vì vậy, cái nhìn cơ bản là có quá nhiều ý tưởng tham gia vào thị trường ý tưởng, và chúng ta cần hiểu những ý tưởng nào cuối cùng sẽ có ảnh hưởng. Tin tốt là chất lượng có ý nghĩa — nếu mọi thứ đều bằng nhau, nghiên cứu tốt hơn sẽ thành công hơn. Tin xấu là chất lượng chỉ có tương quan yếu với thành công, và có nhiều yếu tố khác cũng quan trọng.
Đầu tiên, hãy cho mình nhiều cơ hội. Vai trò của may mắn là một chủ đề thường xuyên trong lời khuyên nghề nghiệp của tôi. Đúng là may mắn có vai trò lớn trong việc xác định bài báo nào thành công, nhưng điều đó không có nghĩa là bạn phải chấp nhận nó. Bạn có thể tăng "diện tích bề mặt may mắn" của mình.
Ví dụ, nếu bạn luôn phát hành các bản thảo trước, bạn có nhiều cơ hội để công việc của bạn được chú ý: một lần với bản thảo trước và một lần với bài báo (thêm vào đó, nếu bạn đang ở trong một lĩnh vực có độ trễ xuất bản lớn, bạn có thể đảm bảo rằng nghiên cứu không bị lấy cắp hoặc không liên quan khi nó được công bố).
Nói chung, hãy coi các dự án nghiên cứu như các công ty khởi nghiệp — chấp nhận rằng có sự biến động rất cao trong kết quả, với một số dự án thành công gấp 10 hoặc 100 lần so với những dự án khác. Điều này có nghĩa là thử nhiều điều khác nhau, thực hiện những cú đánh lớn, sẵn sàng theo đuổi những gì mà đồng nghiệp của bạn coi là ý tưởng tồi, nhưng với một ý tưởng về lý do tại sao bạn có thể thành công ở nơi mà những người khác đã thất bại. Bạn có biết điều gì mà người khác không biết, hay họ biết điều gì mà bạn không biết? Và nếu bạn phát hiện ra rằng đó là điều sau, bạn cần sẵn sàng từ bỏ dự án nhanh chóng, mà không bị rơi vào cái bẫy của chi phí chìm.
Để rõ ràng, thành công không chỉ phụ thuộc vào may mắn — chất lượng và chiều sâu có ý nghĩa rất lớn. Và cần vài năm nghiên cứu để đi sâu vào một chủ đề. Nhưng việc dành vài năm nghiên cứu một chủ đề trước khi bạn xuất bản bất cứ điều gì là cực kỳ rủi ro, đặc biệt là ở giai đoạn đầu trong sự nghiệp của bạn. Giải pháp rất đơn giản: theo đuổi các dự án, không phải các vấn đề.
Các dự án là các chương trình nghiên cứu dài hạn kéo dài từ 3-5 năm hoặc hơn. Một dự án hiệu quả có thể dễ dàng sản xuất một tá hoặc nhiều bài báo (tùy thuộc vào lĩnh vực). Tại sao chọn các dự án thay vì các vấn đề? Nếu phương pháp của bạn là nhảy từ vấn đề này sang vấn đề khác, các bài báo kết quả có khả năng sẽ hơi nông cạn và có thể không có nhiều tác động. Và thứ hai, nếu bạn đã được biết đến với các bài báo về một chủ đề cụ thể, mọi người có khả năng sẽ chú ý hơn đến các bài báo tương lai của bạn về chủ đề đó. (Đúng, danh tiếng tác giả có ý nghĩa rất lớn. Bất kỳ quan niệm bình đẳng nào về cách mọi người chọn những gì để đọc đều là một huyền thoại.)
Tóm lại, tôi thường làm việc trên 2-3 dự án dài hạn cùng một lúc, và trong mỗi dự án có nhiều vấn đề đang được điều tra và nhiều bài báo đang được sản xuất ở các giai đoạn khác nhau của quy trình.
Phần khó nhất là biết khi nào nên kết thúc một dự án. Tại thời điểm bạn đang xem xét một dự án mới, bạn đang so sánh một cái gì đó sẽ mất vài năm để thực sự phát triển với một chủ đề mà bạn đã rất năng suất. Nhưng bạn phải kết thúc một cái gì đó để tạo chỗ cho cái mới. Từ bỏ vào thời điểm đúng luôn cảm thấy như từ bỏ quá sớm. Nếu bạn đi theo cảm giác của mình, bạn sẽ ở lại trong cùng một lĩnh vực nghiên cứu quá lâu.
Cuối cùng, hãy xây dựng phân phối của riêng bạn. Trong quá khứ, việc xuất bản chính thức một bài báo phục vụ hai mục đích: để mang lại độ tin cậy mà đến từ việc đánh giá đồng nghiệp, và để phân phối bài báo đến các đồng nghiệp của bạn. Bây giờ hai chức năng đó đã hoàn toàn bị tách rời. Xuất bản vẫn mang lại độ tin cậy, nhưng phân phối gần như hoàn toàn phụ thuộc vào bạn!
Đó là lý do tại sao mạng xã hội lại quan trọng đến vậy. Thật không may, mạng xã hội giới thiệu những động lực không lành mạnh để phóng đại các phát hiện của bạn, vì vậy tôi thấy các blog/bản tin và video dài là những kênh tốt hơn nhiều. Chúng ta đang ở trong một thời kỳ vàng thứ hai của blogging và có một sự thiếu hụt cực kỳ lớn những người có thể giải thích nghiên cứu tiên tiến từ các lĩnh vực của họ một cách dễ tiếp cận nhưng không làm giảm giá trị như trong các thông cáo báo chí hoặc bài báo tin tức. Không bao giờ là quá sớm — tôi đã bắt đầu một blog trong thời gian học tiến sĩ và nó đã đóng một vai trò lớn trong việc lan tỏa nghiên cứu tiến sĩ của tôi, cả trong cộng đồng nghiên cứu của tôi và bên ngoài nó.
Tóm tắt
* Thành công trong nghiên cứu không chỉ có nghĩa là xuất bản
* Thị trường ý tưởng đã bão hòa
* Hãy cho mình nhiều cơ hội
* Chọn các dự án, không phải các vấn đề
* Đối xử với các dự án như các công ty khởi nghiệp
* Xây dựng phân phối của riêng bạn
39,61K
Arvind Narayanan đã đăng lại
Các chuyên gia về rối loạn nhận thức cơ thể đã cảnh báo rằng những người đang gặp khó khăn với vấn đề này ngày càng phụ thuộc vào các chatbot AI để đánh giá những khuyết điểm mà họ tự nhận thấy và đề xuất các phẫu thuật thẩm mỹ. "Nó gần như xuất hiện trong mọi phiên tư vấn," một nhà trị liệu nói với tôi.

106,83K
Nếu chúng ta so sánh khả năng của AI với con người không có quyền truy cập vào công cụ, chẳng hạn như internet, có lẽ chúng ta sẽ thấy rằng AI đã vượt trội hơn con người trong nhiều hoặc hầu hết các nhiệm vụ nhận thức mà chúng ta thực hiện tại nơi làm việc. Nhưng tất nhiên, đây không phải là một so sánh hữu ích và không cho chúng ta biết nhiều về tác động kinh tế của AI. Chúng ta không có gì nếu không có công cụ của mình.
Và vẫn còn, nhiều dự đoán về tác động của "AGI" dựa trên những so sánh giả thuyết giữa con người và AI trong đó con người có quyền truy cập internet nhưng không có quyền truy cập AI. Loại so sánh này cũng không liên quan.
Câu hỏi thực sự là con người + AI so với AI một mình. Trong một so sánh như vậy, AI sẽ không vượt trội hơn các cặp con người-AI, ngoại trừ trong những lĩnh vực hẹp, nặng về tính toán như trò chơi, nơi tốc độ là điều tối quan trọng và việc có một con người trong bức tranh chỉ làm chậm mọi thứ lại.*
Vì vậy, việc AI có thay thế con người hay không phụ thuộc vào những yếu tố ngoài độ chính xác — những điều như trách nhiệm, khả năng xử lý những điều chưa biết, và sở thích tiềm năng của khách hàng và những người lao động khác trong việc tương tác với một con người, tất cả đều được cân nhắc so với chi phí thuê một con người.
Điều này không có nghĩa là AI sẽ không thay thế công việc. Nhưng nhìn vào các tiêu chuẩn khả năng và đi thẳng đến những tuyên bố về mất việc làm là hoàn toàn ngây thơ.
* Có nhiều nghiên cứu cho thấy công nhân thường xuyên ghi đè AI không chính xác, nhưng đó là vì họ không được đào tạo về khi nào nên ghi đè và khi nào không, điều này là một kỹ năng thiết yếu trong các quy trình làm việc có hỗ trợ AI.
12,62K
Arvind Narayanan đã đăng lại
SB1047 là một ý tưởng tồi. Nhưng SB53 mới nhất của Thượng nghị sĩ Wiener đang đi đúng hướng, và điều quan trọng là phải chỉ ra những tiến bộ. Đây là lý do của tôi.
Cách tiếp cận của tôi đối với việc điều chỉnh công nghệ mới như các mô hình là: chúng ta không biết cách định nghĩa "giảm thiểu" và đảm bảo "tốt" như thế nào, nhưng chúng ta sẽ biết khi - và nếu - chúng ta thấy nó.
Có hai hệ quả.
#1. Chúng ta không nên quy định ngưỡng rủi ro hoặc tiêu chuẩn chăm sóc cho việc phát triển mô hình. Chúng ta không thể đồng ý về những rủi ro quan trọng, cách đo lường chúng, hoặc bao nhiêu là quá nhiều. Hướng dẫn duy nhất cho các nhà phát triển, nhà quản lý và tòa án là một tập hợp các thực tiễn mới nổi chủ yếu được xác định bởi các công ty nguồn đóng dựa vào tường phí để thực hiện công việc nặng nhọc. Làm như vậy có thể làm giảm sự đổi mới mở bằng cách phơi bày các nhà phát triển trước trách nhiệm mơ hồ hoặc gia tăng cho việc phát hành rộng rãi.
Đó là SB1047 trong một câu tóm tắt, cùng với ~5 tương đương mà nó đã truyền cảm hứng trên toàn nước Mỹ trong phiên họp này, chẳng hạn như Đạo luật RAISE ở NY. Chúng ta nên tránh cách tiếp cận đó. Những đề xuất này - trong những khía cạnh hẹp nhưng quan trọng - đã đi quá xa.
Và tuy nhiên:
#2. Chúng ta cần chiếu sáng các thực tiễn trong ngành để hiểu rõ hơn về sự cẩn trọng, hoặc thiếu sót, mà các công ty khác nhau áp dụng. Nếu các nhà phát triển phải cam kết với một chính sách an toàn và bảo mật, cho thấy công việc của họ, và để lại dấu vết giấy tờ, chúng ta có thể đánh giá tốt hơn sức mạnh của các tuyên bố của họ, theo dõi các rủi ro mới nổi, và quyết định về can thiệp trong tương lai.
Đó là Đạo luật AI của EU và Bộ quy tắc thực hành cuối cùng trong một câu tóm tắt, mà cả OpenAI và Mistral đều đã ủng hộ, và đó cũng là phiên bản mới nhất của SB53 từ @Scott_Wiener.
Nếu chúng ta sẽ điều chỉnh việc phát triển mô hình, đó là cách tiếp cận tốt hơn về cơ bản: điều chỉnh tính minh bạch - không phải khả năng, giảm thiểu, hoặc rủi ro chấp nhận được. Nó sẽ cung cấp ít nhất một khu vực pháp lý của Mỹ quyền giám sát của Brussels, và nó sẽ tránh được những tác động không mong muốn đối với phát triển mở.
Để rõ ràng, vẫn còn nhiều trở ngại phía trước:
> Độ phức tạp. Dù là Big Tech hay không, đây là những nghĩa vụ tài liệu và báo cáo nặng nề. Nói một cách chiến thuật, càng phức tạp, dự luật này sẽ càng dễ bị tổn thương.
> Khuyến khích. Việc báo cáo công khai bắt buộc các đánh giá rủi ro tự nguyện tạo ra một động lực sai lệch cho các nhà phát triển để không thử nghiệm mô hình của họ đủ, và làm ngơ trước những rủi ro khó khăn. Cho phép các nhà phát triển công bố kết quả của họ cho các kiểm toán viên hoặc cơ quan thay vì công khai có thể giúp thúc đẩy sự trung thực hơn trong các đánh giá nội bộ của họ.
> Ngựa thành Troy. Văn hóa sửa đổi và cắt bỏ quá mức của California có thể làm cho việc thẩm định các dự luật này trở nên khó khăn. Nếu SB53 biến thành một dự luật tiêu chuẩn chăm sóc như SB1047 hoặc RAISE, nó nên bị bác bỏ vì những lý do tương tự như trước. Càng nhiều đồ trang trí được thêm vào cây thông Giáng sinh này, dự luật càng trở nên gây tranh cãi.
> Phạm vi. Dự luật này vươn ra một cách rộng rãi với các định nghĩa mở rộng về rủi ro thảm khốc và khả năng nguy hiểm. Đối với một dự luật "báo cáo bắt buộc / thực hành tự nguyện", chúng hoạt động. Nếu dự luật này là một dự luật tiêu chuẩn chăm sóc, chúng sẽ không khả thi.
Tóm lại: xin chúc mừng Thượng nghị sĩ Wiener vì đã tham gia và phản hồi một cách suy nghĩ trong suốt năm qua. Thật refreshing khi thấy một dự luật thực sự xây dựng trên những chỉ trích trước đó. Vẫn còn nhiều con đường mà dự luật này có thể đi - và nó đã phát triển vượt xa đề xuất tố giác ban đầu - nhưng quỹ đạo là đầy hứa hẹn.

5,97K
Arvind Narayanan đã đăng lại
Đối với những người đang thắc mắc điều gì đang xảy ra ở đây về mặt kỹ thuật, một lời giải thích:
Khi có nhiều dữ liệu huấn luyện với một phong cách cụ thể, việc sử dụng một phong cách tương tự trong yêu cầu của bạn sẽ kích hoạt LLM phản hồi theo phong cách đó. Trong trường hợp này, có rất nhiều fanfic:
🧵
180,24K
Arvind Narayanan đã đăng lại
Bài viết mới: Ảo tưởng về Trung tâm dữ liệu
Trong số các cường quốc trung bình, UAE có chiến lược AI rõ ràng nhất: trở thành một 'quốc gia dầu AI' với thị phần tính toán toàn cầu có ý nghĩa. Hầu hết các quốc gia khác đang xây dựng các trung tâm dữ liệu mà không nhắm đến các ngưỡng chủ quyền khả thi.
🧵

10,01K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất