谷歌“Project Jarvis”:面向消费者的Chrome自动化
项目概述
谷歌最新的AI项目,代号为“Project Jarvis”,旨在重新定义消费者与网络浏览器的互动方式。该项目专门为Chrome设计,旨在自主控制浏览器,使其能够在无需用户干预的情况下执行常见的在线任务。预计将于12月与谷歌的新Gemini语言模型一同发布,Project Jarvis代表了谷歌将复杂自动化带给普通消费者的承诺。
工作原理
Project Jarvis的技术利用了视觉识别的力量。通过分析Chrome浏览器窗口的截图,AI自主执行点击按钮、填写表单或输入文本等任务。这种自动化针对广泛的网络活动,包括:
- 进行在线搜索
- 购买商品
- 预订航班
- 处理其他常规网络任务
然而,该AI系统存在一些局限性。例如,每个动作可能需要几秒钟来处理,因为Jarvis需要一个“思考”间隔来评估下一步行动。此外,对于处理敏感数据(如密码和信用卡信息)的担忧,如果管理不善,可能会带来风险。
战略背景
有趣的是,Project Jarvis被视为AI战略的更广泛转变的一部分。随着语言模型接近能力上限,像谷歌这样的大公司正在寻求创新方式来展示AI的实际效用。Jarvis提供了一条这样的途径,将Chrome转变为日常便利的AI辅助平台。尽管“Jarvis”这个名字在谷歌的战略讨论中早已出现,但前用户体验策略师Scott Jenson曾批评它是一种防御策略,旨在将用户留在谷歌生态系统中,而不是大胆前进。
Anthropic的自动化:超越Chrome的更广泛应用
更广泛的系统访问和功能
与谷歌的Project Jarvis专注于网页自动化不同,Anthropic采取了更广泛的方法。其自动化系统不仅限于网页浏览器,而是设计用于控制多种应用程序,包括生产力工具、系统级软件,甚至更高级的环境。
Anthropic的目标用户是需要跨平台协助的开发者、办公室工作人员和企业客户,支持从编码到文档管理的广泛用例。与旨在帮助消费者进行网络搜索和购买的Project Jarvis不同,Anthropic的重点是技术性和专业任务,如:
- 直接在集成开发环境(IDEs)中编写和运行代码
- 管理电子表格并与项目管理工具互动
- 处理复杂的工作流程,如数据处理或文档管理
方法和安全性
Anthropic的系统结合了多种方法,包括命令行自动化、API集成和GUI(图形用户界面)自动化,使其能够深入与不同软件环境互动。它高度重视隐私和安全,特别是在其系统访问级别更高的情况下,可能会暴露敏感用户数据。因此,安全处理密码和财务信息成为首要任务。
当前局限性
尽管Anthropic的系统具有优势,但仍面临延迟问题,尤其是在跨多个应用程序处理复杂命令时。任务范围越广,响应速度的变异性越大,某些工作流程的速度会因所需的互动水平而变慢。然而,Anthropic旨在利用这些能力展示AI在对话界面之外的实际效用。
初创企业在大科技进入市场后的困境
谷歌和Anthropic进入桌面和浏览器自动化领域,给曾经开创AI驱动代理自动化工具的初创企业带来了巨大压力。以下是2024年专注于桌面和代理自动化的几家知名初创企业。
1. Adept AI
Adept AI在AI领域引起了轰动,获得了3.5亿美元的融资,并展示了其旗舰AI代理ACT-1,该代理能够自主控制各种软件应用程序。尽管备受关注,Adept尚未发布面向公众的产品。其重点仍然是改进Fuyu-Heavy模型和Adept工作流语言(AWL)等技术,但这些努力尚未转化为具体的产品。
2. SuperAGI
SuperAGI提供了一个开源框架,用于构建能够执行各种软件互动(包括推理和视觉互动)的自主代理。SuperAGI的开源性质允许企业根据特定需求定制这些代理,但可扩展性和来自大型平台的竞争带来了重大挑战。
3. Lindy.ai
Lindy.ai将自己定位为“AI员工”平台,旨在自主管理由电子邮件或日历事件触发的桌面任务。Lindy的代理(称为“Lindies”)可以协同工作,处理复杂的工作流程,但该平台在扩展这些代理以满足谷歌和Anthropic提供的产品标准方面面临挑战。
转变:初创企业在科技巨头主导的市场中难以立足
随着谷歌和Anthropic的进入,AI驱动自动化市场发生了巨大变化。以下是初创企业在竞争中面临的核心挑战:
1. 市场主导和资金差距
谷歌和Anthropic拥有庞大的资金和资源,能够以初创企业无法匹敌的规模开发和推出复杂的、基础设施密集型的自动化能力。快速开发周期和基础设施支持使得初创企业在可扩展性、安全性和速度方面难以竞争。
2. 技术和安全优势
大公司已经遵守严格的安全和隐私协议,这在通过AI自动化处理敏感数据时是一个显著优势。它们的解决方案对需要合规和强大安全性的企业更具吸引力,这为小型初创企业设定了难以达到的高标准。
3. 产品开发速度
初创企业传统上以敏捷性为竞争优势,但这一点已基本消失。大型科技公司正在加速其AI发布周期,利用战略合作伙伴关系和收购快速将新功能推向市场。当初创企业仍在努力从原型阶段过渡时,谷歌和Anthropic已经提供了成熟、用户就绪的解决方案。
4. 信任和差异化挑战
对于初创企业来说,赢得用户信任是一个重大障碍,特别是在主要玩家提供可靠解决方案的环境中。投资者和消费者对那些被认为具有投机价值而没有明确可交付产品的小公司越来越持怀疑态度。许多初创企业尚未找到一个独特的价值主张,而这一价值主张尚未被谷歌和Anthropic等公司更广泛、更强大的产品所覆盖。
AI驱动自动化的未来:巨头与初创企业
谷歌和Anthropic进入AI浏览器和桌面自动化领域,标志着新篇章的开始——在这个篇章中,大型科技公司日益占据主导地位,留给小型初创企业的空间有限。除非这些初创企业能够转向满足高度专业化、利基需求,或建立独特的、可防御的合作伙伴关系,否则它们在这个拥挤的市场中生存的道路似乎很狭窄。谷歌的Project Jarvis针对消费者任务,而Anthropic的广泛、面向企业的自动化解决方案共同展示了AI从对话能力到集成、系统级能力的快速演变。未来显然更倾向于大型科技公司在自动化领域的优势,可能会重新定义用户与数字工具互动的方式。