阿里云联合中大发现16万种新病毒2025-3-31 编辑:采编部 来源:互联网
导读:阿里云与中山大学团队利用AI模型LucaProt,将已知RNA病毒种类扩充近30倍,相关成果登《Cell》封面。本文解析这一突破如何重塑病毒发现范式,并为生物信息学研究提供新工具。
在浩瀚的微生物世界中,存在大量无法通过传统方法识别的“暗物质病毒”,它们缺乏与已知病毒的同源性,如同基因库中的幽灵,长期以来是科学界难以攻克的死角。然而,这一局面正被一项由科技巨头与顶尖学府联手取得的突破所改变。阿里云与中山大学联合团队,通过将人工智能深度应用于病毒发现领域,成功挖掘出16万余种全新RNA病毒,将人类已知病毒库的规模瞬间提升了近30倍。这一里程碑式的研究,不仅为全球生物信息学界提供了全新的研究范式,也预示着AI在生命科学探索中的巨大潜力。 AI如何破解病毒圈的“暗物质”难题?在传统病毒发现路径中,科学家主要依赖序列同源性比对,即通过寻找与已知病毒相似的“基因指纹”来识别新病毒。但这种方法在面对演化距离极远、同源性极低甚至缺失的RNA病毒时,往往束手无策。这正是阿里云与中山大学研究的核心切入点。 研究团队创新性地提出了基于Transformer架构的深度学习模型“LucaProt”。该模型不依赖序列比对,而是通过学习RNA聚合酶等关键功能蛋白的序列结构与模式,实现对“暗物质病毒”的高效识别。实验证明,该模型在病毒发现的准确率、效率以及多样性上,均显著优于传统方法。通过对来自全球生物环境样本的10,487份数据进行深度挖掘,团队最终发现了513,134条病毒基因组,代表161,979个潜在病毒种及180个RNA病毒超群。这一成果使RNA病毒超群数量扩容约9倍,其中23个超群是无法通过序列同源方法识别的真正“暗物质”。 这一发现将如何影响未来的生物信息学研究?对于关注生命科学前沿的科技从业者而言,这项研究的价值远不止于病毒数量的增长。它标志着AI驱动的“功能驱动”发现范式正在取代传统的“同源性驱动”范式,为生物信息学开辟了新路径。 范式转变:从“找相似”到“识功能”传统方法如同在图书馆中寻找与已知书籍封面相似的书,而LucaProt模型则如同一位能理解内容主旨的专家,即便书籍封面完全不同,也能准确分类。这种方法论上的革新,使得研究人员能够探索此前无法触及的、演化上孤立的病毒分支,从而更完整地理解RNA病毒的多样性、演化历史及其与宿主的相互作用。 工具赋能:从RNA病毒到蛋白质功能发现这一模型的成功,不仅限于病毒学领域。其背后的技术路径——利用人工智能从海量序列数据中挖掘功能性生物分子——具有极强的通用性。阿里云在生命科学领域已布局多项成果,除了用于RNA病毒发现的LucaProt,还推出了核酸和蛋白质统一基础模型LucaOne、磷循环蛋白家族识别模型LucaPCycle等。这表明,由LucaProt验证的技术框架,未来有望广泛应用于蛋白质功能鉴定、新酶挖掘、生物标志物发现等多个前沿方向,成为推动整个生命科学领域发展的底层驱动力。 这项突破性成果的学术分量有多重?判断一项科研成果的含金量,国际顶级学术期刊的认可与权威机构的背书是重要标尺。 首先,该研究成果凭借在病毒学领域的多项突破,成功登上国际顶级学术期刊《Cell》的封面。这代表着国际学术界的最高认可之一,充分证明了研究的原创性、创新性和深远影响力。 其次,该成果入选了中国科学院旗下《基因组蛋白质组与生物信息学报》公布的2024年度“中国生物信息学十大进展”。这一来自国内权威学术机构的认定,进一步凸显了该研究在中国生物信息学年度发展中的标志性地位。
这一系列来自权威机构与顶级期刊的认可,共同构筑了该研究的坚实可信证据链,使其成为AI驱动生命科学探索领域的一个里程碑事件。 总结与展望:AI与生命科学的深度融合阿里云与中山大学的此次联合研究,成功地将人工智能的算力与生物信息学的洞察力相结合,破解了病毒发现领域的“暗物质”难题,并取得了病毒超群数量扩容约9倍的卓越成果。这不仅为全球病毒学研究贡献了海量新知识和高效新工具,也向业界展示了跨学科合作在解决重大科学问题上的巨大潜力。未来,随着LucaProt这类AI模型在更多生物信息学任务中的应用与迭代,我们有理由相信,人类对生命微观世界的认知将迎来一个加速突破的新时代。 本文为【广告】 文章出自:互联网,文中内容和观点不代表本网站立场,如有侵权,请您告知,我们将及时处理。 上一篇:京东超市亿元补贴打造宠物爆品
|
||||||||||