OpenAI 发布“深度研究”,以改变人工智能驱动的知识工作

作者
Super Mateo
8 分钟阅读

OpenAI推出“深度研究”:人工智能知识工作的重大突破

OpenAI推出了“深度研究”,这是一个集成到ChatGPT中的尖端人工智能工具,专门为金融、科学、政策和工程等领域的高级知识工作而设计。这个工具对于消费者研究任务也很有价值,比如评估汽车、电器和家具。最初只提供文本回复,OpenAI计划在未来的更新中引入图像和数据可视化。

主要细节:

  • **可用性:**目前ChatGPT Pro用户可以使用,每月限额100次查询,一个月内将扩展到Plus和Team用户。企业用户也将计划开通。
  • **地区限制:**在英国、瑞士或欧洲经济区不可用。
  • **设备兼容性:**最初仅限网页版,预计本月晚些时候支持移动端和桌面端。
  • **技术基础:**由OpenAI专门的“o3推理模型”驱动,该模型针对网页浏览、文本处理和数据分析进行了优化。
  • **功能:**支持用户上传文件,处理文本、图像和PDF,并在5-30分钟内提供带有引用的完整文档输出。
  • 性能:在“人类最后的考试”中取得了26.6%的准确率,显著优于Gemini Thinking、Grok-2和GPT-4o等竞争对手。
  • **培训与开发:**使用端到端强化学习,在浏览和推理任务上进行训练,允许进行多步骤轨迹规划和实时反应。
  • 与HLE的基准测试:“人类最后的考试”包含3000个专家级问题,涵盖100多个学科,由来自500多个机构的数千名专家开发,使其成为最困难的人工智能评估基准之一。

主要结论

1. 人工智能向专家级知识综合的演变

“深度研究”是人工智能在综合和解释复杂信息方面的一大进步,标志着人工智能从单纯的人工智能辅助向真正的研究能力的转变。

2. 人工智能市场的竞争优势

此次发布是在谷歌推出其“深度研究”功能后不久进行的,突显了科技巨头在人工智能驱动的知识工作方面的激烈竞争。

3. 局限性和挑战

尽管具有先进的推理能力,“深度研究”仍面临关键障碍:

  • **信息真实性:**在区分可信来源和虚假信息方面存在潜在挑战。
  • **推理错误:**逻辑推理和格式化方面可能出现错误。
  • **引用可靠性:**用户可能需要手动验证来源。
  • **不确定性处理:**该模型并不总是恰当地传达其置信水平,这可能会误导用户。

4. 通用人工智能和人工智能研究的未来

专家和用户推测,“深度研究”可能是迈向通用人工智能的关键一步,特别是由于其迭代推理过程和生成超过10,000字的专家级报告的能力。

5. 爱因斯坦的类比:人工智能的思考潜力

一些用户将“深度研究”的推理与阿尔伯特·爱因斯坦的思考过程进行了有趣的比较。理论家认为,如果人工智能能够长时间持续处理信息(例如,每年2000万个token),它可能会做出类似于人类天才的突破性发现。


深度分析:“深度研究”背后的科学

1. 强化学习与多步骤推理

“深度研究”利用端到端强化学习,使其能够通过经验进行改进。它擅长多步骤问题解决、回溯和实时信息更新。

2. “人类最后的考试”基准测试

HLE是一个极具挑战性的基准测试,包含100多个学科的3000个专家级问题,由500多个机构开发。它旨在突破人工智能推理的极限,并可能成为评估人工智能智能的新行业标准。

3. 知识综合:通向通用人工智能的关键?

一些人工智能研究人员认为,该模型的**“搜索-思考-搜索-思考”**方法模仿了人类专家的推理。一种理论认为,如果人工智能能够以高速(例如,每年2000万个token)持续处理信息,理论上它可能会产生与爱因斯坦级别的发现相媲美的见解。

4. 市场背景与竞争压力

谷歌在OpenAI发布前两个月就宣布了类似的“深度研究”工具,这表明人工智能研究领域正在升温。OpenAI的回应旨在确立其在人工智能驱动的知识综合领域的主导地位。

5. 未来增强与数据集成

预计“深度研究”将与订阅式研究数据库和专有数据源集成,以进一步增强其功能。此举可能会在多个行业提供无与伦比的研究见解。


你知道吗?

  • “深度研究”可以通过多次研究迭代,实时改进其响应,从而优于传统的人工智能模型。
  • 其在HLE上的准确率为26.6%,高于以往的任何人工智能模型,但一些专家认为这低估了其真实能力。
  • **谷歌和OpenAI现在都有一个名为“深度研究”的产品,**加剧了人工智能领域的竞争。
  • “深度研究”在GAIA测试中获得了72.57分,这是另一个针对人工智能研究能力的严格基准。
  • 它遵循“搜索-思考-搜索-思考”的方法,类似于人类分析师处理复杂研究任务的方式。
  • 用户报告说,它可以生成超过10,000字的研究分析师级别的报告,这是当前人工智能模型前所未有的能力。
  • 未来的更新可能包括实时数据可视化和交互式研究工具,使人工智能生成的见解更容易获得。

结论

OpenAI的“深度研究”不仅仅是另一次人工智能升级,它是人工智能向专家级知识综合和问题解决演变过程中的一个里程碑。尽管仍然存在挑战,但其在各个行业中革新研究和决策的潜力是不可否认的。随着竞争的加剧,人工智能驱动的研究前景一片光明,OpenAI正引领着我们朝着更加智能和分析性的数字助手迈进。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯