OpenAI推理模型: 从基因数据中锁定18种罕见病

遗传病诊断从来不是一蹴而就的事。尤其对儿童罕见病来说，从基因测序到锁定致病突变，往往需要专家数月甚至数年的反复排查。OpenAI 最近公布的一项研究让人看到另一种可能——他们用自家推理模型处理了一批此前“无解”的病例，结果识别出 18 种全新诊断。

为什么罕见病诊断这么难

罕见病之所以“罕见”，很大程度上是因为每个病种的样本极少，医生的临床经验也难以覆盖。加上基因数据里存在大量意义不明的变异（VUS），靠传统生物信息学工具和人工判读，经常走到死胡同。OpenAI 这次瞄准的正是这类“死胡同”病例——那些经过标准分析流程仍找不到答案的案例。

研究团队没有使用普通的 LLM，而是专门选了具备多步推理能力的模型（类似于 o1 系列）。他们让模型阅读患者的基因变异列表、临床表型描述以及现有文献，然后模拟医生诊断时的逻辑链条：从表型出发筛选候选基因，再比对变异致病性，最后给出置信度排名。

18 个新诊断从哪来

数据来源是一个公开的儿童罕见病数据库，里面包含数百个已确认诊断和一批未解案例。模型在未解案例里找到了 18 个此前被遗漏的诊断，其中一部分涉及新发突变或非编码区变异——这些恰恰是常规分析最容易漏掉的部分。

为了验证可靠性，OpenAI 与几位独立遗传学家合作，对模型输出的每个新诊断做了人工复核。最终确认的错误率在可接受范围内，说明模型并非“瞎猜”，而是真的学到了某种隐形模式。当然，研究也强调：所有 AI 输出都必须经过临床验证，不能直接用作治疗依据。

实际影响：缩短“诊断漂泊”周期

对罕见病患者家庭来说，“诊断漂泊”（diagnostic odyssey）是常态——平均需要 5 到 7 年才能得到明确病因。这个数字背后是无数无效检查和心理煎熬。OpenAI 的方法如果能嵌入医院现有工作流，可能把分析时间从几个月压缩到几天。尤其对基因检测能力不足的地区，一个经专业训练的 AI 模型可以充当“第二意见”角色。

但要注意，这项研究目前仍是回顾性验证，距离真正临床部署还有很长的路。数据隐私、模型幻觉、与电子病历系统的对接，都是待解决的问题。