熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Mark Chen
@OpenAI 首席研究官。美國 IOI 隊教練。
我們在今年的國際數學奧林匹克(IMO)中達到了金牌級別的表現!我們的模型能夠用清晰、簡單的英語思考和撰寫證明 - 不需要正式的代碼。
與過去比賽中使用的狹隘系統不同,我們的模型旨在進行廣泛的推理,遠超過比賽問題。

Alexander Wei7月19日 15:50
1/N 我很高興地分享,我們最新的 @OpenAI 實驗性推理 LLM 在人工智慧領域達成了一項長期以來的重大挑戰:在世界上最具聲望的數學競賽——國際數學奧林匹克(IMO)中獲得金牌級別的表現。

144.49K
我們在 @atcoder 世界總決賽的啟發式比賽中進行了現場競賽,並獲得了第二名!
像 o3 這樣的模型在編程/數學比賽中排名前100,但據我所知,這是首次在一個頂級編程/數學比賽中獲得前3名的成績。前100名和前3名之間有著巨大的差距!

Ahmed El-Kishky7月17日 02:52
恭喜 @FakePsyho 在緊張刺激的表現!同樣也要祝賀 @bminaiev、@andresnds 和 @_lorenzkuhn 代表 OpenAI 的精彩表現。贊助 AtCoder 世界總決賽 @atcoder 真是太棒了。我們很高興能與全世界分享一些模型解決方案。
54.02K
Mark Chen 已轉發
我對於鏈式思維的忠實性和可解釋性的潛力感到非常興奮。這對我們的推理模型設計產生了重大影響,從 o1-preview 開始。
隨著 AI 系統在長期研究問題上花費更多的計算資源,監控其內部過程的某種方式變得至關重要。隱藏的鏈式思維(CoTs)有一個奇妙的特性,即雖然它們最初是基於我們可以解釋的語言,但可擴展的優化過程並不會對觀察者驗證模型意圖的能力造成對抗性影響——這與例如使用獎勵模型的直接監督不同。
這裡的緊張關係在於,如果 CoTs 默認不被隱藏,並且我們將這一過程視為 AI 的輸出的一部分,那麼就會有很多動機(在某些情況下甚至是必要性)來對其進行監督。我相信我們可以朝著兩全其美的方向努力——訓練我們的模型在解釋其內部推理方面表現出色,但同時仍然保留偶爾驗證的能力。
CoT 的忠實性是更廣泛研究方向的一部分,即可解釋性的訓練:以某種方式設置目標,使系統的至少一部分保持誠實和可監控,並隨著規模的增長而進行訓練。我們正在繼續增加在 OpenAI 這項研究上的投資。
264.19K
我們不會在研究上過度招聘。在 talent bar 上 - 下個月會有一些非常了不起的人加入!
我花了幾年時間進行交易,直到缺乏意義讓我筋疲力盡。在 OAI,我從來沒有這種感覺 - 構建具有現實世界影響的東西要有成就感得多。

Iain Dunning2025年5月17日
你是 OAI/Anthropic/etc 的研究員,厭倦了過度招聘、組織結構圖混亂、人才門檻降低、想搬到紐約,或者只是想做一些不同的事情嗎?給我發電子郵件,給我發 DM,郵寄一張明信片。我們有一個充滿 B200 的新數據中心,團隊緊密,非常成功。
221.94K
很高興能與 @fidjissimo 合作 - 她是一位有遠見的產品!

Sam Altman2025年5月8日
很高興 @fidjissimo 以一個新的角色加入 OpenAI:應用程式首席執行官,向我彙報。
我將繼續擔任OpenAI的CEO,但在這種新的配置中,我將能夠更加專注於研究、計算和安全。
在我們接近超級智慧時,這些都至關重要。
77.88K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可