遺傳病診斷從來不是一蹴而就的事。尤其對兒童罕見病來說,從基因測序到鎖定致病突變,往往需要專家數月甚至數年的反覆排查。OpenAI 最近公佈的一項研究讓人看到另一種可能——他們用自家推理模型處理了一批此前「無解」的病例,結果識別出 18 種全新診斷。
為什麼罕見病診斷這麼難
罕見病之所以「罕見」,很大程度上是因為每個病種的樣本極少,醫生的臨床經驗也難以覆蓋。加上基因資料裡存在大量意義不明的變異(VUS),靠傳統生物資訊學工具和人工判讀,經常走到死衚衕。OpenAI 這次瞄準的正是這類「死衚衕」病例——那些經過標準分析流程仍找不到答案的案例。
研究團隊沒有使用普通的 LLM,而是專門選了具備多步推理能力的模型(類似於 o1 系列)。他們讓模型閱讀患者的基因變異列表、臨床表型描述以及現有文獻,然後模擬醫生診斷時的邏輯鏈條:從表型出發篩選候選基因,再比對變異致病性,最後給出置信度排名。
18 個新診斷從哪來
資料來源是一個公開的兒童罕見病資料庫,裡面包含數百個已確認診斷和一批未解案例。模型在未解案例裡找到了 18 個此前被遺漏的診斷,其中一部分涉及新發突變或非編碼區變異——這些恰恰是常規分析最容易漏掉的部分。
為了驗證可靠性,OpenAI 與幾位獨立遺傳學家合作,對模型輸出的每個新診斷做了人工複核。最終確認的錯誤率在可接受範圍內,說明模型並非「瞎猜」,而是真的學到了某種隱形模式。當然,研究也強調:所有 AI 輸出都必須經過臨床驗證,不能直接用作治療依據。
實際影響:縮短「診斷漂泊」週期
對罕見病患者家庭來說,「診斷漂泊」(diagnostic odyssey)是常態——平均需要 5 到 7 年才能得到明確病因。這個數字背後是無數無效檢查和心理煎熬。OpenAI 的方法如果能嵌入醫院現有工作流,可能把分析時間從幾個月壓縮到幾天。尤其對基因檢測能力不足的地區,一個經專業訓練的 AI 模型可以充當「第二意見」角色。
但要注意,這項研究目前仍是回顧性驗證,距離真正臨床部署還有很長的路。資料隱私、模型幻覺、與電子病歷系統的對接,都是待解決的問題。
一點務實看法
這項工作的亮點不在於「AI 比醫生厲害」,而在於它展示了推理模型如何與人類知識互補。罕見病診斷很依賴跨領域聯想,比如某個骨骼異常加上特定心臟缺陷,可能指向一個冷門綜合徵——模型恰好擅長這種非線性的模式匹配。未來更務實的路徑或許是:AI 生成候選列表,醫生再做最終判斷和驗證。
對於關注 AI 落地醫療的朋友,值得留意的是 OpenAI 這次特意選擇了開源資料庫和可復現的方法,研究論文和部分程式碼已經公開。這意味著其他團隊也能在自己的資料集上覆現,甚至針對不同疾病領域微調模型。這種開放態度,比單純秀成績更有實際價值。
最後說句實在話:罕見病是全球醫療系統共同的難題,任何一個能降低診斷門檻的技術進步都值得關注。但 AI 在這裡的角色永遠只是輔助——最終拍板、解釋、安慰患者的,仍然是醫生。











評論
暫無評論
成為第一個評論的人