很高興分享兩項進展,讓我們更接近醫療保健 AI 的實際影響: SDBench 引入了一個新的基準測試,可將 304 個 NEJM 病例轉換為互動式診斷類比。AI 必須提出問題、訂購測試並權衡成本,這反映了實際臨床決策的複雜性。 MAI-DxO 是一個與模型無關的編排器,用於類比一組虛擬醫生。它實現了 85.5% 的診斷準確率,是經驗豐富的醫生的四倍,同時降低了診斷成本。 這些進步共同為 AI 如何幫助在醫療保健領域提供精確性和效率提供了藍圖,我們期待與醫療保健合作夥伴和整個生態系統合作,利用這些進步產生影響。
686.31K