OpenAI 的 Operator 开启自主 AI 新时代,革新工作和生活

作者
Super Mateo
10 分钟阅读

OpenAI发布Operator:一款有望改变生产力的自主AI代理

OpenAI发布了其最新创新成果——Operator,这是一款具有突破性的自主AI代理,旨在独立执行复杂的多步骤任务。Operator于周四发布,代表着OpenAI在通往通用人工智能(AGI)的道路上迈出了重要一步。这款新型代理有望通过自动化各种各样的任务来重新定义生产力,从网页浏览和网上购物到行程规划和电子邮件管理。凭借其先进的功能,Operator将成为个人和企业不可或缺的工具,标志着人机协作的新时代。

功能和特性:多功能AI助手

Operator配备了一套多样化的功能,使其能够在无需人工干预的情况下处理各种任务。这些功能包括:

  • **网页浏览和网上购物:**Operator可以浏览网页,进行购买,甚至可以计算取消订单的退款。
  • **数据管理:**该代理可以在内部销售数据库中查找特定客户,分析电子表格,并合并PDF文件。
  • **沟通:**Operator可以发送电子邮件和下载文件,从而简化沟通和文件管理。
  • **旅行和生活方式:**从预订餐厅到规划行程,Operator可以轻松处理个人和职业事务。
  • **多任务处理:**类似于打开多个浏览器标签页,Operator可以同时执行多个任务。例如,它可以在Etsy上订购个性化珐琅马克杯,同时在Hipcamp上预订露营地。

技术架构:背后的运作机制

Operator由一个新的**计算机使用代理(CUA)**模型提供支持,该模型集成了多项先进技术:

  • **GPT-4o的视觉功能:**Operator可以通过屏幕截图“看到”用户的屏幕,使其能够像人类一样与图形用户界面(GUI)进行交互。
  • **GUI交互:**该代理可以点击、输入和滚动,使其能够浏览复杂的界面。
  • **高级推理和强化学习:**Operator使用基于文本的思维链推理进行决策,确保其能够精确地处理复杂的任务。
  • **基准性能:**该模型在WebArena和WebVoyager基准测试中均取得了最先进的结果,展示了其卓越的能力。

安全措施:确保负责任的使用

OpenAI实施了强大的安全功能,以减轻与Operator相关的潜在风险:

  • **任务拦截:**该代理会拦截有害或非法的任务,并列入黑名单与赌博、成人娱乐、毒品零售和枪支相关的网站。
  • **实时监控:**自动安全检查器实时审查用户交互,并对禁止使用的情况进行额外的人工审查。
  • **用户确认:**在执行提交或发送电子邮件等操作之前,Operator需要用户确认。
  • **限制性任务:**为了确保安全,目前限制了诸如银行交易等高风险任务。

可用性和访问权限:谁可以使用Operator?

目前,Operator仅向美国的ChatGPT Pro订阅用户提供,每月订阅费用为200美元。OpenAI计划将来将其访问权限扩展到Plus、Team和Enterprise用户。符合条件的用户可以通过operator.chatgpt.com访问Operator,该代理最终将集成到ChatGPT的主界面中。

战略背景:迈向AGI的一步

Operator的发布与OpenAI将2025年定位为“代理AI之年”的愿景相一致。此次发布紧随最近推出的ChatGPT任务之后,该任务允许用户自动化未来的提示。这些创新共同突显了OpenAI致力于提升AI能力,并使ChatGPT成为用户必不可少的工具。

Operator也代表了OpenAI从AI到AGI的五级进展中的一个重要里程碑:

  1. **聊天机器人:**参与对话的AI。
  2. **推理器:**解决人类级别问题的AI。
  3. **代理:**执行基于行动的任务的AI。
  4. **创新者:**开发创新AI的AI。
  5. **组织者:**完成组织级别工作的AI。

OpenAI表示,Operator只是未来几周和几个月内计划发布的众多代理中的第一个。此外,o3-mini模型将提供给免费ChatGPT用户,进一步扩展对先进AI能力的访问。

专家观点:各种各样的看法

Operator的推出引起了专家们各种各样的反应:

支持性观点:

  • **生产力提升:**支持者强调Operator自动化日常任务的潜力,从而显著提高生产力。通过利用在文本和图像上训练的AI模型,Operator可以解释命令并操作网页浏览器,从而简化各种日常和专业活动。
  • **技术里程碑:**专家们认为Operator是AI发展的一个重要步骤,使模型能够使用人类通常使用的工具,并扩展了各种新应用的潜力。

批评性观点:

  • **安全和滥用问题:**批评者对潜在的风险表示担忧,包括行为不当和滥用。OpenAI承认这些担忧,并实施了安全措施,例如在不可逆转的操作之前需要用户确认,以及限制对银行交易等敏感任务的访问。
  • **可用性挑战:**一些专家指出,虽然Operator展示了令人鼓舞的能力,但在复杂的界面和某些任务方面可能仍然面临挑战,这表明该技术并非万无一失。

市场影响和预测:代理经济的曙光

Operator不仅仅是一个产品;它预示着人机协作的范式转变。通过使AI能够在现实世界系统上执行多步骤任务,OpenAI正在为代理经济奠定基础——在这个时代,代理以超乎人类能力的规模和精度与数字生态系统互动、操纵和优化。

1. 市场影响:新的生产力层级

Operator重新定义了工作方式,降低了运营效率的成本。流程繁重的行业(如法律、物流、医疗保健和金融)将从中受益匪浅。Operator消除了重复性的瓶颈,从而催生了全新的商业模式和工作流程。

2. 利益相关者中的赢家和输家

  • **赢家:**小型企业、AI驱动型企业和开发者将获得传统上仅供大型企业使用的能力,从而创造公平的竞争环境并创造新的机遇。
  • **输家:**随着Operator展示了AI驱动自动化的灵活性和效率,中层管理职位和低效率的技术提供商可能会面临颠覆。

3. 投资者的战略见解

Operator代表着基础设施建设,有可能蚕食传统的SaaS厂商。Operator应用商店的出现可能会为第三方开发者创造一个新的生态系统,而个人AI代理的兴起将催化消费者代理经济。

4. 大胆预测:宏观趋势和不可预见的后果

  • **以人为中心的界面的终结:**随着AI代理主导使用,GUI可能会成为遗产,迫使各行各业围绕代理机交互进行自我改造。
  • **AI代理作为组织:**自主代理可以作为虚拟公司运营,从而挑战全球的法律和监管框架。
  • **对道德AI控制的争夺:**自主代理的潜在滥用强调了快速监管发展演变的必要性。

最后的思考:智能的工业革命

Operator是代理优先革命的开场白。其真正的影响不在于它今天所做的事情,而在于它明天所赋能的事情。通过将推理与行动结合起来,Operator消除了意图与执行之间的摩擦,预示着智能的工业革命。尽早认识到其影响并果断行动的利益相关者将顺应这项变革性技术的浪潮,而犹豫不决的人则可能面临被自动化淘汰的风险。

您可能也喜欢

本文是根据我们的用户在 新闻提交规则和指南下提交的。封面照片是计算机生成的艺术作品,仅用于说明目的;不表明实际内容。如果您认为本文侵犯了版权,请毫不犹豫地通过 发送电子邮件给我们来举报。您的警惕和合作对帮助我们维护尊重和合法合规的社区至关重要。

订阅我们的通讯

通过独家预览了解我们的新产品,获取企业业务和技术的最新资讯