Nous Research发布Hermes 3人工智能模型

Nous Research发布Hermes 3人工智能模型

作者
Kai Takahashi
5 分钟阅读

Nous Research发布Hermes 3 AI模型系列

Nous Research推出了一款名为Hermes 3的新型AI模型系列,这些模型以其高度的控制性和中立性著称,与可能存在伦理限制的其他模型有所区别。Hermes 3模型有三种规格——80亿、700亿和4050亿参数——基于Meta的开源Llama 3.1构建。这些模型旨在严格遵循用户指令,并能根据用户指定的世界观进行调整。

Hermes 3模型在推理、奖励建模和生成结构化输出(包括XML标签)等任务中表现出色。此外,它们还能生成用于透明决策的内心独白和创建如Mermaid图表等视觉内容。这些模型通过两步训练过程,包括监督微调和直接偏好优化,在初始阶段使用了近4亿个标记。

在测试中,Hermes 3模型表现优异,在ARC、BoolQ、HellaSwag、IFEval和Winogrande等基准测试中领先于开源模型。这些模型接受了推理任务和创意应用(如角色扮演和写作)的混合训练。它们还具备使用外部工具和通过检索增强生成(RAG)从文档中检索信息的能力,从而提供更准确和相关的答案。

Hermes 3模型在Hugging Face平台上可用,因其在一系列应用中的多功能性而受到认可,从商业决策到创意任务均有涉及。专家认为Hermes 3是AI领域的重要参与者,反映了行业向提供灵活性和成本效益的开源AI模型发展的趋势。

关键要点

  • Nous Research发布了基于Meta的Llama 3.1的Hermes 3 AI语言模型系列。
  • Hermes 3模型有80亿、700亿和4050亿参数三种规格,设计用于高度的可控性和中立性。
  • 这些模型在推理和结构化输出等任务中表现出色,在公共基准测试中得分领先。
  • 训练涉及监督微调和直接偏好优化,使用了近4亿个标记。
  • Hermes 3模型可在Hugging Face上使用,支持外部工具和基于文档的信息检索。

分析

Nous Research基于Meta的Llama 3.1开发的Hermes 3 AI模型,可能会颠覆需要精确AI交互的行业。它们的高度可控性和中立性增强了在金融、医疗和法律等领域的应用。在Hugging Face上的可用性扩大了它们的可访问性,可能会提升Nous Research的市场份额。竞争对手可能会加速创新以匹配Hermes 3的能力。长期来看,这些模型可能会标准化AI行为,影响全球的伦理AI发展。

你知道吗?

  • Hermes 3模型:
  • 解释: Hermes 3是由Nous Research开发的一系列先进AI语言模型,基于Meta的开源Llama 3.1架构。这些模型以其高度的可控性和中立性著称,意味着它们可以严格遵循用户指令,不受可能限制其他AI模型的伦理约束。它们有三种规格——80亿、700亿和4050亿参数——每种都设计用于处理推理、奖励建模和使用XML标签的结构化输出等复杂任务。
  • 直接偏好优化(DPO):
  • 解释: 直接偏好优化是用于Hermes 3模型开发的一种训练技术。与依赖监督学习后进行人类反馈的强化学习的传统方法不同,DPO直接根据人类通过奖励模型表达的偏好优化模型的响应。这种方法简化了训练过程,增强了模型更有效地与用户意图对齐的能力。
  • 检索增强生成(RAG):
  • 解释: 检索增强生成是一种增强Hermes 3等AI模型能力的技术,允许它们在生成响应时访问和利用外部信息源,如文档或数据库。这意味着模型可以通过从这些外部源提取相关信息,提供更准确和上下文相关的答案,从而增强其自然语言生成能力。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯