• 服务邮箱 msc@ssjst.cn

  • 微信号码 ssjst-news

人工智能技术

AI破解生命“暗码”:AlphaGenome解码人类98%非编码区,开启精准医疗新纪元

556

       2026年1月29日,《自然》杂志以封面论文形式刊发了谷歌DeepMind团队的重磅研究成果——AI模型AlphaGenome成功实现对人类基因组中98%非编码区的系统性解析。这一突破彻底打破了人类对“暗基因组”的认知僵局,将曾经被视为“垃圾DNA”的神秘区域转化为可解读的生物学指令,为遗传病研究、新药研发开辟了前所未有的广阔空间,标志着AI与生命科学的融合进入全新发展阶段。

       人类基因组由30亿个碱基对构成,其中仅约2%的区域负责编码蛋白质,调控人体生长发育与生理功能,这部分被称为编码区;剩余98%的序列不直接参与蛋白质合成,长期以来因功能不明被科学家称为“垃圾DNA”,也被喻为生命基因组中的“暗物质”。事实上,近年来的研究已逐步证实,这些非编码区并非毫无价值,而是蕴含着复杂的基因调控密码,其内部的调控元件如同生命活动的“开关”,决定着基因在何种细胞、何种时间、以何种强度表达,而这些“开关”的异常变异,正是众多遗传病、癌症、神经退行性疾病的核心诱因之一。

       此前,由于非编码区序列庞大、调控机制复杂,且缺乏高效的解析工具,人类对其功能的探索一直举步维艰。传统研究方法不仅耗时费力,且难以兼顾长序列上下文与单碱基分辨率的双重需求,往往只能解读局部片段,无法捕捉远端调控元件的作用,导致大量与疾病相关的非编码变异始终无法找到致病机制,成为困扰遗传诊断与新药研发的关键瓶颈。据统计,全球超过50%的神经发育障碍患者,虽高度怀疑存在遗传病因,但通过传统检测手段始终无法找到明确致病变异,其根源就在于这些变异大多隐藏在未被解析的非编码区中。

       AlphaGenome的问世,彻底打破了这一技术困境。作为一款全新的统一DNA序列深度学习模型,它实现了三大核心技术突破,成为解码“暗基因组”的关键钥匙。首先,它打破了长度与精度的折衷魔咒,能够一次性处理长达100万个碱基对的DNA序列,是前代模型处理能力的5倍,同时保持单碱基级别的精准预测,这意味着即使是距离目标基因数十万碱基之外的远端调控元件,也能被精准捕捉其调控作用。其次,它构建了“一专多能”的多模态预测体系,无需切换多个专用模型,就能同时预测超过5000种不同细胞类型和分子层面的特征轨道,涵盖基因表达、染色质开放性、转录因子结合、三维基因组结构等11大类调控模态,一次性输出基因调控的完整“全景图”。最后,它实现了从“预测”到“效应评分”的跨越,通过创新的知识蒸馏训练策略,能够快速模拟DNA序列变异后的分子层面影响,精准判断某个变异可能导致的基因调控异常,为解读致病机制提供直接依据。

       性能测试显示,AlphaGenome的综合能力已达到行业顶尖水平。在26项变异效应预测基准测试中,它在25项上达到或超过现有最优模型,其中在细胞类型特异性基因表达预测中,相较于同类多模态模型实现了14.7%的相对提升;在T细胞白血病、血红蛋白病等疾病的研究中,它成功预测并验证了非编码区变异的致病机制,其预测结果与传统实验结果的相关系数高达0.89,精准度得到充分验证。更值得关注的是,AlphaGenome的计算效率极高,在普通GPU上评估单个变异的耗时不足1秒,完整训练仅需4小时,计算资源消耗仅为前代模型的一半,这为其大规模临床应用奠定了基础。

       这一突破的价值,正逐步延伸到医学研究与产业应用的多个核心领域,为人类健康事业带来革命性改变。在遗传病研究领域,AlphaGenome为“意义未明变异”的解读提供了强大工具,有望将罕见病的诊断率从目前的20%-30%提升至40%以上,帮助更多遗传病患者找到致病根源,实现精准诊断与遗传咨询。例如,它已成功精准验证了DLG1基因外显子跳跃、COL6A2基因新剪接连接等案例的致病机制,为相关罕见病的诊断提供了直接依据。

       在新药研发领域,AlphaGenome大幅降低了药物靶点发现的难度与成本。传统新药研发中,靶点筛选往往需要耗费数年时间和巨额成本,且失败率极高,而AlphaGenome能够高通量、低成本地模拟非编码变异对基因调控网络的影响,帮助科学家快速筛选出具有明确生物学意义的药物靶点,大幅降低研发早期的失败风险。同时,基于对非编码区调控机制的深入理解,“增强子疗法”等新型治疗手段正逐步走向成熟,为癌症、神经退行性疾病等难治性疾病提供了全新的治疗思路。

       业内专家评价认为,AlphaGenome对非编码区的成功解析,其意义不亚于人类基因组计划的完成,它不仅填补了人类对基因调控机制认知的空白,更重构了AI辅助生命科学研究的模式。伦敦大学学院马克-曼索尔教授表示,AlphaGenome是破解非编码区变异的关键拼图,尤其是在癌症研究中,其能够精准还原从变异到致癌的全链条机制,为癌症的早期筛查与靶向治疗提供了全新路径。

       当然,这场生命“暗码”的解码之战仍有漫长的路要走。目前,AlphaGenome在远端调控建模、条件特异变异效应解读等方面仍存在局限,非编码区中还有大量调控元件的功能尚未被完全挖掘,其研究成果向临床应用的转化也需要更多的实验验证与伦理规范。但不可否认的是,AlphaGenome的突破已为人类打开了一扇通往生命本质的新大门,AI与生命科学的深度融合,正推动精准医疗进入“全基因组解读”的新时代。

       未来,随着AlphaGenome模型的持续优化,以及更多跨学科研究的深入开展,人类有望彻底破解“暗基因组”的全部密码,将基因调控机制的研究成果全面应用于疾病预防、诊断与治疗,让曾经的“垃圾DNA”成为守护人类健康的“宝藏密码”,为全球健康事业注入前所未有的新动能。

联系邮箱

coo@ssjst.cn

微信二维码

扫一扫,微信咨询