OpenAI推理模型: 從基因資料中鎖定18種罕見病

遺傳病診斷從來不是一蹴而就的事。尤其對兒童罕見病來說，從基因測序到鎖定致病突變，往往需要專家數月甚至數年的反覆排查。OpenAI 最近公佈的一項研究讓人看到另一種可能——他們用自家推理模型處理了一批此前「無解」的病例，結果識別出 18 種全新診斷。

為什麼罕見病診斷這麼難

罕見病之所以「罕見」，很大程度上是因為每個病種的樣本極少，醫生的臨床經驗也難以覆蓋。加上基因資料裡存在大量意義不明的變異（VUS），靠傳統生物資訊學工具和人工判讀，經常走到死衚衕。OpenAI 這次瞄準的正是這類「死衚衕」病例——那些經過標準分析流程仍找不到答案的案例。

研究團隊沒有使用普通的 LLM，而是專門選了具備多步推理能力的模型（類似於 o1 系列）。他們讓模型閱讀患者的基因變異列表、臨床表型描述以及現有文獻，然後模擬醫生診斷時的邏輯鏈條：從表型出發篩選候選基因，再比對變異致病性，最後給出置信度排名。

18 個新診斷從哪來

資料來源是一個公開的兒童罕見病資料庫，裡面包含數百個已確認診斷和一批未解案例。模型在未解案例裡找到了 18 個此前被遺漏的診斷，其中一部分涉及新發突變或非編碼區變異——這些恰恰是常規分析最容易漏掉的部分。

為了驗證可靠性，OpenAI 與幾位獨立遺傳學家合作，對模型輸出的每個新診斷做了人工複核。最終確認的錯誤率在可接受範圍內，說明模型並非「瞎猜」，而是真的學到了某種隱形模式。當然，研究也強調：所有 AI 輸出都必須經過臨床驗證，不能直接用作治療依據。

實際影響：縮短「診斷漂泊」週期

對罕見病患者家庭來說，「診斷漂泊」（diagnostic odyssey）是常態——平均需要 5 到 7 年才能得到明確病因。這個數字背後是無數無效檢查和心理煎熬。OpenAI 的方法如果能嵌入醫院現有工作流，可能把分析時間從幾個月壓縮到幾天。尤其對基因檢測能力不足的地區，一個經專業訓練的 AI 模型可以充當「第二意見」角色。

但要注意，這項研究目前仍是回顧性驗證，距離真正臨床部署還有很長的路。資料隱私、模型幻覺、與電子病歷系統的對接，都是待解決的問題。