Google DeepMind 於 2026 年 05 月 01 日推出 AI 共同臨床醫師(AI co-clinician),這是一項研究計畫,旨在探討多模態 AI 系統如何更有效地協助醫療工作者與患者。根據世界衛生組織(World Health Organization)的說法,該專案回應全球醫療體系所面臨的日益增壓力:在預計至 2030 年將出現超過 1,000 萬名醫療工作者短缺的情況下,改善成效、降低成本並擴大照護取得。
新系統預計探索「三方照護」(triadic care)模式:AI 代理程式與醫師及患者共同工作,而非取代臨床判斷。DeepMind 表示,其目標是打造能延伸臨床醫師觸及範圍的工具,同時讓醫師掌控決策。該公司將此項努力定位為其醫療 AI 研究的下一步,延續先前系統如 MedPaLM(著重醫療知識測試)以及 AMIE(以文字形式的模擬諮詢進行操作)。
AI 共同臨床醫師的一項關鍵特性是它能處理的不只是文字。系統曾以現場音訊與影像進行測試,使其能觀察步態、呼吸模式以及可見的皮膚變化等生理線索。在遠距醫療模擬中,模型能協助患者完成身體檢查的部分流程,並支援如檢查吸入器使用技巧或協助辨識肩部受傷等任務。這些能力顯示,多模態 AI 最終可能支援遠端諮詢,特別是在視覺與聽覺觀察十分重要的情境下。
DeepMind 強調系統內建的安全控制。AI 共同臨床醫師採用雙代理(dual-agent)設計:一個「Planner」會持續檢視互動並確認「Talker」是否仍在臨床界線之內。該公司表示,這種結構旨在降低不安全輸出並提升醫療情境中的可靠性,因為事實正確性與克制表達至關重要。
研究團隊透過多種方式評估系統。在一項測試中,他們調整了 NOHARM 安全框架,以同時衡量不正確回應與未能提出重要資訊的失敗。在包含 98 項基層照護(primary care)查詢的盲測比較中,該系統在 97 個案例中記錄為零個關鍵錯誤,且在醫師的偏好上優於其他證據彙整工具。DeepMind 表示,這意味著該模型可作為臨床醫師尋求紮實、品質高的臨床資訊的有用工具。
研究也進一步檢視系統在使用 OpenFDA RxQA 基準來處理與用藥相關問題的表現;該基準旨在測試對藥物與治療的知識與推理。在開放式評估中,AI 共同臨床醫師優於其他前沿模型,顯示在一個特別重要於日常照護規劃的領域上已有進展。
然而,在面向患者的模擬中,人類醫師整體仍表現更佳。研究團隊與來自哈佛與史丹佛的大學醫師合作,進行了一項隨機研究,包含 20 個合成的臨床情境與 10 位醫師扮演的患者角色(patient-actors)。在超過 140 個被評估的項目中,醫師在辨識警訊與指導身體檢查方面均優於 AI;即便系統在 68 個類別(包含分流 triage)中與或超越了醫師表現。研究結果顯示,該工具可能最有價值的是作為支援系統,而非替代臨床專業。
DeepMind 表示,更廣泛的目標是開發能協助醫師、且值得信任、具有臨床根據,並能適應真實世界照護環境的 AI。公司正持續在多個國家推進研究合作,包括美國、印度、澳洲、紐西蘭、新加坡以及阿拉伯聯合大公國,因其正努力在更為多樣的醫療情境中測試該系統。