深势科技发布三个新的开源库,粉碎星际之门5000亿美元的计划并驳斥马斯克的质疑

作者
Lang Wang
8 分钟阅读

深势科技开源风暴:AI基础设施的颠覆者,马斯克的说法被推翻

深势科技在AI基础设施领域投下重磅炸弹

深势科技再次震撼AI行业,在#开源周 期间发布了前所未有的开源项目。 这家公司如同上了一堂精彩的工程大师课,公开了另外三项关键技术,这些技术重新定义了AI模型训练的效率:DualPipe、EPLB和一个广泛的性能分析数据集。 这一举措不仅巩固了深势科技作为全球AI系统工程领导者的地位,也暴露了美国主要AI基础设施项目的效率低下,特别是OpenAI的星门项目,该项目旨在未来四年内投入5000亿美元用于AI基础设施建设。

通过此次最新发布,深势科技有效地驳斥了埃隆·马斯克的指控,后者此前指责该公司虚报其训练成本。 这些优化背后的透明度证明,深势科技的方法比美国AI巨头预期的更具成本效益和效率。 更为关键的是,它对美国主要AI基础设施团队的能力提出了严峻的质疑,他们现在面临着一家中国公司在本世纪最重要的技术竞赛之一中超越他们的现实。

深势科技最新开源版本的三大支柱

1. DualPipe:流水线并行性的范式转变

深势科技的DualPipe是一种双向流水线并行算法,旨在消除训练效率低下问题。 传统的流水线并行性经常会受到“流水线气泡”的影响,即GPU由于正向和反向传播之间的等待依赖关系而保持空闲状态。 DualPipe通过完全重叠计算和通信来解决这个问题,将空闲时间减少到接近于零。

🔹 主要特点:

  • 通过动态同步正向和反向传递来消除训练效率低下。
  • 通过消除传统流水线训练造成的瓶颈来提高GPU利用率
  • 通过最大化计算效率和最小化浪费的处理能力来降低训练成本

🚀 影响: 深势科技使用DualPipe使其能够以仅557万美元的成本训练DeepSeek-V3——仅为OpenAI据报道在类似模型上花费的一小部分。 这种优化是其能够以极低的成本提供高性能AI的关键因素之一。

2. EPLB:用于高效MoE训练的专家并行负载均衡器

EPLB,或专家并行负载均衡器,是深势科技针对混合专家模型中一个经常被忽视的问题的解决方案:GPU之间的负载不平衡。 MoE架构将不同的神经网络专家分配给不同的GPU,但工作负载差异会导致效率低下,从而减慢训练和推理速度。

🔹 主要特点:

  • 通过复制高流量专家并智能地重新分配任务来动态平衡计算负载
  • 优化跨节点通信,减少延迟并提高整体性能。
  • 实时适应不断变化的工作负载模式,确保始终获得最佳的GPU利用率。

🚀 影响: EPLB确保深势科技分布式系统中的每个GPU都得到充分利用。 这转化为更高效的训练、更低的运营成本和大规模AI部署中的卓越性能。

3. 性能分析数据集:无与伦比的透明度

深势科技当天发布的最后一个开源项目是用于性能分析的综合数据集。 与美国AI公司将他们的优化技术隐藏在专有墙后不同,深势科技正在将其基准测试和性能分析数据完全公开。

🔹 主要特点:

  • 包括展示深势科技优化实际效果的真实训练数据
  • 提供对GPU利用率、内存效率和通信瓶颈的深入见解
  • 允许开发人员和研究人员独立验证深势科技关于卓越训练效率的主张。

🚀 影响: 这一举措彻底驳斥了埃隆·马斯克和其他人提出的指控,他们认为深势科技在训练成本方面具有欺骗性。 该数据集的透明度证明深势科技的效率提升是真实的、可重现的,并且远优于美国AI公司目前的方法

投资者见解和行业影响

深势科技的开源风暴不仅仅是一个技术里程碑,它还是一个具有广泛影响的战略杰作,将对全球AI基础设施市场产生深远影响。

  • 反击批评者:包括埃隆·马斯克声称深势科技夸大其训练成本数据的说法在内的近期行业知名人士的主张已被这些发布有效地驳斥。 DualPipe、EPLB和性能分析数据提供的具体证据清楚地表明,成本效率是真实且可验证的。
  • 削弱星门项目:雄心勃勃的5000亿美元的星门项目——计划立即在美国AI基础设施中部署1000亿美元——现在看来已经脱节。 深势科技的有形创新暴露了过度炒作的承诺与实际、可证明的效率改进之间的鲜明对比。
  • 呼吁问责制:鉴于这些突破,许多投资者和行业专家都在质疑美国顶级科技公司的AI基础设施部门的能力。 新出现的共识是,这些部门必须进行彻底的改革——如果不是完全被取代——才能在这个快速发展的领域保持竞争力。

深势科技的开源战略是对美国AI主导地位的直接挑战

深势科技的最新举措不仅仅是一项工程成就,它还是一个战略举措,可能会改变AI行业的权力平衡。 通过证明可以用美国公司声称的成本的一小部分来训练高性能AI,深势科技正在推动AI发展经济学的范式转变

仅仅一周的开源发布,深势科技就将自己定位为世界上最先进的AI模型开发者,有效地羞辱了其美国竞争对手美国主要科技公司的AI基础设施团队应该重新评估他们的整个方法——如果不是他们的就业状况的话。 这不仅仅是更有效地训练AI,而是关于定义AI的未来。

随着开源周的结束,一个主要问题仍然存在:深势科技下一步会揭示什么? 如果历史可以作为参考,那么AI世界将再次面临一场变革。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯