OpenAI推理模型: 從基因資料中鎖定18種罕見病

OpenAI推理模型: 從基因資料中鎖定18種罕見病

Sophia Bennett
110
original

OpenAI研究團隊利用其推理模型分析兒童罕見遺傳病案例,在以往未確診的病例中發現了18種新診斷。這項工作展示了AI在輔助醫生解讀複雜基因資料、縮短診斷週期方面的潛力,尤其對資源有限的罕見病診療有現實意義。

遺傳病診斷從來不是一蹴而就的事。尤其對兒童罕見病來說,從基因測序到鎖定致病突變,往往需要專家數月甚至數年的反覆排查。OpenAI 最近公佈的一項研究讓人看到另一種可能——他們用自家推理模型處理了一批此前「無解」的病例,結果識別出 18 種全新診斷。

為什麼罕見病診斷這麼難

罕見病之所以「罕見」,很大程度上是因為每個病種的樣本極少,醫生的臨床經驗也難以覆蓋。加上基因資料裡存在大量意義不明的變異(VUS),靠傳統生物資訊學工具和人工判讀,經常走到死衚衕。OpenAI 這次瞄準的正是這類「死衚衕」病例——那些經過標準分析流程仍找不到答案的案例。

研究團隊沒有使用普通的 LLM,而是專門選了具備多步推理能力的模型(類似於 o1 系列)。他們讓模型閱讀患者的基因變異列表、臨床表型描述以及現有文獻,然後模擬醫生診斷時的邏輯鏈條:從表型出發篩選候選基因,再比對變異致病性,最後給出置信度排名。

18 個新診斷從哪來

資料來源是一個公開的兒童罕見病資料庫,裡面包含數百個已確認診斷和一批未解案例。模型在未解案例裡找到了 18 個此前被遺漏的診斷,其中一部分涉及新發突變非編碼區變異——這些恰恰是常規分析最容易漏掉的部分。

為了驗證可靠性,OpenAI 與幾位獨立遺傳學家合作,對模型輸出的每個新診斷做了人工複核。最終確認的錯誤率在可接受範圍內,說明模型並非「瞎猜」,而是真的學到了某種隱形模式。當然,研究也強調:所有 AI 輸出都必須經過臨床驗證,不能直接用作治療依據。

實際影響:縮短「診斷漂泊」週期

對罕見病患者家庭來說,「診斷漂泊」(diagnostic odyssey)是常態——平均需要 5 到 7 年才能得到明確病因。這個數字背後是無數無效檢查和心理煎熬。OpenAI 的方法如果能嵌入醫院現有工作流,可能把分析時間從幾個月壓縮到幾天。尤其對基因檢測能力不足的地區,一個經專業訓練的 AI 模型可以充當「第二意見」角色。

但要注意,這項研究目前仍是回顧性驗證,距離真正臨床部署還有很長的路。資料隱私、模型幻覺、與電子病歷系統的對接,都是待解決的問題。

一點務實看法

這項工作的亮點不在於「AI 比醫生厲害」,而在於它展示了推理模型如何與人類知識互補。罕見病診斷很依賴跨領域聯想,比如某個骨骼異常加上特定心臟缺陷,可能指向一個冷門綜合徵——模型恰好擅長這種非線性的模式匹配。未來更務實的路徑或許是:AI 生成候選列表,醫生再做最終判斷和驗證。

對於關注 AI 落地醫療的朋友,值得留意的是 OpenAI 這次特意選擇了開源資料庫可復現的方法,研究論文和部分程式碼已經公開。這意味著其他團隊也能在自己的資料集上覆現,甚至針對不同疾病領域微調模型。這種開放態度,比單純秀成績更有實際價值。

最後說句實在話:罕見病是全球醫療系統共同的難題,任何一個能降低診斷門檻的技術進步都值得關注。但 AI 在這裡的角色永遠只是輔助——最終拍板、解釋、安慰患者的,仍然是醫生。

罕見病診斷AI輔助醫療OpenAI基因資料分析推理模型診斷漂泊兒童遺傳病臨床決策支援開源研究

分享

評論

0
0/500 字元

暫無評論

成為第一個評論的人

探索更多