遗传病诊断从来不是一蹴而就的事。尤其对儿童罕见病来说,从基因测序到锁定致病突变,往往需要专家数月甚至数年的反复排查。OpenAI 最近公布的一项研究让人看到另一种可能——他们用自家推理模型处理了一批此前“无解”的病例,结果识别出 18 种全新诊断。
为什么罕见病诊断这么难
罕见病之所以“罕见”,很大程度上是因为每个病种的样本极少,医生的临床经验也难以覆盖。加上基因数据里存在大量意义不明的变异(VUS),靠传统生物信息学工具和人工判读,经常走到死胡同。OpenAI 这次瞄准的正是这类“死胡同”病例——那些经过标准分析流程仍找不到答案的案例。
研究团队没有使用普通的 LLM,而是专门选了具备多步推理能力的模型(类似于 o1 系列)。他们让模型阅读患者的基因变异列表、临床表型描述以及现有文献,然后模拟医生诊断时的逻辑链条:从表型出发筛选候选基因,再比对变异致病性,最后给出置信度排名。
18 个新诊断从哪来
数据来源是一个公开的儿童罕见病数据库,里面包含数百个已确认诊断和一批未解案例。模型在未解案例里找到了 18 个此前被遗漏的诊断,其中一部分涉及新发突变或非编码区变异——这些恰恰是常规分析最容易漏掉的部分。
为了验证可靠性,OpenAI 与几位独立遗传学家合作,对模型输出的每个新诊断做了人工复核。最终确认的错误率在可接受范围内,说明模型并非“瞎猜”,而是真的学到了某种隐形模式。当然,研究也强调:所有 AI 输出都必须经过临床验证,不能直接用作治疗依据。
实际影响:缩短“诊断漂泊”周期
对罕见病患者家庭来说,“诊断漂泊”(diagnostic odyssey)是常态——平均需要 5 到 7 年才能得到明确病因。这个数字背后是无数无效检查和心理煎熬。OpenAI 的方法如果能嵌入医院现有工作流,可能把分析时间从几个月压缩到几天。尤其对基因检测能力不足的地区,一个经专业训练的 AI 模型可以充当“第二意见”角色。
但要注意,这项研究目前仍是回顾性验证,距离真正临床部署还有很长的路。数据隐私、模型幻觉、与电子病历系统的对接,都是待解决的问题。
一点务实看法
这项工作的亮点不在于“AI 比医生厉害”,而在于它展示了推理模型如何与人类知识互补。罕见病诊断很依赖跨领域联想,比如某个骨骼异常加上特定心脏缺陷,可能指向一个冷门综合征——模型恰好擅长这种非线性的模式匹配。未来更务实的路径或许是:AI 生成候选列表,医生再做最终判断和验证。
对于关注 AI 落地医疗的朋友,值得留意的是 OpenAI 这次特意选择了开源数据库和可复现的方法,研究论文和部分代码已经公开。这意味着其他团队也能在自己的数据集上复现,甚至针对不同疾病领域微调模型。这种开放态度,比单纯秀成绩更有实际价值。
最后说句实在话:罕见病是全球医疗系统共同的难题,任何一个能降低诊断门槛的技术进步都值得关注。但 AI 在这里的角色永远只是辅助——最终拍板、解释、安慰患者的,仍然是医生。











评论
暂无评论
成为第一个评论的人