Evo 2 以空前的规模和精度推进人工智能驱动的基因研究

作者
CTOL Editors - Ken
7 分钟阅读

Evo 2:生物学领域最大的人工智能模型,革新基因研究

人工智能和生物学领域取得一项突破性进展:Arc 研究院NVIDIA 合作推出了 Evo 2,这是迄今为止基因组学领域规模最大的人工智能模型。来自 斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员在这个项目中发挥了关键作用,该项目将改变我们对基因的理解。Evo 2 是一种生成式人工智能模型,它基于来自生命三大领域的 128,000 个完整基因组9.3 万亿个核苷酸进行训练,使科学家能够预测致病突变、模拟生物进化,甚至设计合成基因组

研究人员于 2025 年 2 月 19 日发布了关于 Evo 2 模型的详细预印本,同时还发布了一个用户友好的工具,名为 Evo Designer。Evo 2 代码将是开源的,从而实现广泛的可访问性和协作。通过在 AWS 上的 NVIDIA DGX Cloud AI 平台上利用 2,000 多个 NVIDIA H100 GPU,该模型在一次处理多达 100 万个核苷酸的基因序列方面取得了突破。

主要要点

  • 生物学领域最大的人工智能模型: Evo 2 是有史以来最强大的生物人工智能模型,基于 9.3 万亿个 DNA/RNA 碱基对进行训练。
  • 预测疾病突变: Evo 2 在识别致病突变(例如与乳腺癌相关的突变)方面实现了 90% 以上的准确率
  • 基因组工程潜力: 该模型可以设计整个基因组,为合成生物学的发展铺平道路。
  • 与 NVIDIA 合作: Evo 2 使用 StripedHyena 2 架构进行训练,这是一种新颖的人工智能框架,可实现大规模生物计算。
  • 开源促进科学进步: Evo 2 的完整训练数据、模型权重和代码将提供给全球研究界使用。

深入分析

大规模生物人工智能的力量

Evo 2 代表了基因研究的范式转变,它允许科学家通过人工智能驱动的方法分析远距离基因组相互作用。与以前需要大量特定任务微调的模型不同,Evo 2 作为一个通用模型发挥作用,学习所有生命领域基因序列中的基本模式。

Evo 2 如何实现无与伦比的性能

  • 百万级Token 上下文窗口: 该模型处理长的基因序列,捕获传统模型错过的遥远关系。
  • StripedHyena 2 架构: 这种多混合卷积框架确保了前所未有规模的高效人工智能训练。
  • 基因组零样本学习: Evo 2 准确地预测了跨物种的基因变异影响,而无需事先对特定任务进行训练
  • 机械可解释性: 与人工智能实验室 Goodfire 合作开发的专用可视化工具使研究人员能够了解 Evo 2 如何识别关键基因特征。

对科学和工业的影响

学术研究
  • 加速基础生物学研究,从而深入了解基因调控、蛋白质功能和进化生物学
  • 连接人工智能和基因组学,促进计算科学家和实验科学家之间的跨学科合作。
  • 开创生成生物学,从而创造具有所需特征的合成 DNA 序列。
医疗和制药行业
  • 个性化医疗: Evo 2 在预测遗传疾病风险方面的高准确性可以彻底改变诊断方法。
  • 药物发现: 人工智能辅助的基因分析可以识别新的治疗靶点并优化药物设计
  • 基因治疗: 精确控制工程基因元素的能力可以加强对复杂疾病的治疗。
生物工程和农业
  • 合成生物学应用,包括设计用于工业过程的微生物菌株
  • 农业改良,例如通过基因优化提高抗病性和产量的作物。

伦理考量

研究团队已通过将感染人类的病原体排除在训练数据集之外,从而考虑了伦理因素。此外,斯坦福医学院的生物伦理实验室指导团队确保负责任的人工智能部署。

您知道吗?

  • Evo 2 比其前身 Evo 1 的数据丰富 30 倍,使其能够模拟 128,000 个基因组,而不仅仅是单细胞生物
  • 该模型使用 2,000 多个 NVIDIA H100 GPU 进行训练,使其成为生物学领域最大的人工智能训练项目之一
  • Evo 2 可以分析 BRCA1 基因中的突变,其准确性高于传统的基因检测方法
  • Evo 2 的训练数据集 OpenGenome2有史以来编译的最多样化的生物序列数据集
  • Evo 2 背后的人工智能架构 StripedHyena 2 是在 OpenAI 联合创始人 Greg Brockman 的参与下开发的。

最后的想法

Evo 2 不仅仅是一个人工智能模型,它还是在基因水平上理解和设计生命的革命性一步。凭借其在医学、合成生物学和农业领域的应用,其开源性质必将增强全球研究人员的能力。人工智能和生物学的融合从未如此有希望,而 Evo 2 正引领着我们进入 人工智能驱动的生命科学时代。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯