DeepSeek 是真正的开源,还是仅仅遵循行业规范?

作者
CTOL Editors - Ken
6 分钟阅读

DeepSeek 真的开源吗?行业标准的真相

人工智能研究公司 DeepSeek 最近以 MIT 许可证发布了其大型语言模型(LLM),提供了模型权重、推理代码和技术文档。然而,该公司没有发布其训练代码,引发了关于 DeepSeek 是否真的可以被认为是“开源”的激烈辩论。

这场争议源于对大型语言模型背景下“开源”构成的不同解读。虽然有些人认为,没有训练代码,模型就不能被认为是完全开源的,但另一些人强调,DeepSeek 的做法符合 Meta、谷歌和阿里巴巴等领先人工智能公司遵循的行业规范。

要点总结

  1. DeepSeek 的开源方法

    • 以 MIT 许可证发布模型权重
    • 提供推理代码和技术文档
    • 没有发布训练代码,导致对其开源可信度的辩论
  2. 开源 LLM 的行业标准

    • 大多数公司(Meta、谷歌、阿里巴巴)遵循类似的模型
    • 标准做法包括共享权重和推理代码,但不共享训练代码
    • 完全开源的版本(包括训练代码)很少见
  3. 实际考虑

    • LLM 的训练成本极高(DeepSeek v3 的训练成本:3000万人民币)
    • 由于文件大小巨大,模型权重托管在 Hugging Face 上
    • 社区从访问权重中受益,从而能够进行微调和实验
  4. 社区反应

    • 有人批评缺乏训练代码,认为这限制了透明度
    • 另一些人强调开放权重和本地部署的实际好处
    • 包括 OpenAI 在内的主要人工智能公司也受到了类似的批评

深入分析:行业背景和影响

人工智能行业中更广泛的开源视角

DeepSeek 在处理开源人工智能的方式上并非个例。自 Meta 发布 Llama 2 以来,发布模型权重而不发布训练代码的做法已成为行业规范。谷歌(Gemma)、阿里巴巴(Qwen)和 GLM4 系列等公司也采用了类似的政策。即使是 Llama 2 也包含商业限制,限制月活跃用户超过 7 亿的公司使用。

为什么公司不发布训练代码?答案在于成本、复杂性和竞争优势。训练像 DeepSeek v3 这样的大型模型需要数千万美元的计算资源。此外,人工智能公司将其训练方法视为商业机密,以确保其模型保持竞争力。

缺乏训练代码重要吗?

虽然批评人士认为训练代码对于完全透明是必要的,但大多数 LLM 用户并不需要它。开放权重允许开发者:

  • 针对特定任务微调模型
  • 在本地部署模型
  • 进行实验并创建下游应用

此外,许多人工智能模型依赖于 PyTorch、transformers 和 vLLM 等标准框架,这使得无需明确访问训练脚本即可推断架构细节和功能。

社区观点和双重标准

一个新兴的担忧是,与西方公司相比,DeepSeek 和其他中国人工智能公司是否面临更严格的审查。批评人士指出,名字中有“开放”一词的 OpenAI 根本不发布模型权重,但 DeepSeek 尽管遵循与 Meta 和谷歌相同的做法,却受到了更严厉的批评。

讨论反映了科技辩论中更广泛的模式——最初的炒作,随后的强烈反对,然后是更平衡的重新评估。DeepSeek 的发布遵循了这一周期,最初对其能力的兴奋让位于对其开源声明的批评。

你知道吗?关于开源人工智能的鲜为人知的事实

  • OLMO 是为数不多的真正开源的 LLM 之一,不仅发布了权重,还发布了训练代码和数据。然而,完全开源的模型仍然是小众的,主要用于教育和研究目的。
  • 人工智能模型权重通常托管在 Hugging Face 上,而不是 GitHub 上,因为它们的文件大小巨大,这使得中国的一些用户难以直接访问。
  • 关于开源人工智能的辩论并不新鲜。关于“开放性”的讨论可以追溯到 OpenAI 的早期,当时它从一个开放的研究实验室转变为商业人工智能巨头。
  • 大型人工智能模型的训练成本非常高昂。例如,训练 GPT-4 可能花费了数亿美元,这使得大多数组织即使拥有完整的训练代码也无法复制。

最后想法

DeepSeek 的开源人工智能方法遵循行业规范,即使它与传统的开源软件定义不一致。关键问题是,LLM 领域的开源是否应该优先考虑完全透明(训练代码、数据和权重)还是实际可访问性(模型权重和推理能力)。目前,大多数人工智能开发者都受益于开放权重,从而实现现实世界的应用和创新。

关于人工智能中的“开源”意味着什么的辩论将继续下去,但 DeepSeek 在其方法上绝非孤例。随着人工智能研究的不断发展,这个快速发展领域中的开放性定义也将不断发展。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯