谷歌的 AI 三重奏:Ironwood、Agent2Agent 和 Vertex 生成媒体为企业 AI 树立新标杆
在今天的 Cloud Next 25 大会上,谷歌云发布了三项突破性的 AI 公告,这标志着企业人工智能的基础设施、互操作性和创造能力发生了巨大的转变。每个版本——Ironwood TPU、Agent2Agent 协议和 Vertex AI 生成媒体套件——本身都是一项成就。但总的来说,它们形成了一个引人注目的论点:人工智能的未来是推理优先、代理驱动和原生多模态的。
从用 Ironwood 惊人的 42.5 百万兆次浮点运算的推理优化计算重新定义超级计算,到用 Agent2Agent 标准化 AI 代理通信,再到用 Vertex 的生成管道将数周的创意制作压缩到数小时——谷歌云不仅仅是在迭代。它正在编排一个企业 AI 超级结构,其雄心远超当今碎片化、资源密集型的常态。
“推理时代”:Ironwood TPU 重新定义 AI 基础设施
在液体冷却的工业嗡嗡声和超大规模数据中心的光芒下,一种新型智能正在诞生——不是在学习中,而是在理解中。谷歌的第七代张量处理单元 Ironwood 标志着 AI 硬件发展的一个决定性转折点:它是该公司第一个专门为推理而构建的芯片,推理是指部署已经训练好的模型,以大规模地进行推理、响应和反应。
一位熟悉 Ironwood 部署的系统架构师评论说:“这是一个新的计算前沿。我们已经有十年专注于训练的硬件。但推理是实时价值的交付地——对于用户、工作流程和业务成果而言。”
Ironwood 拥有高达 9,216 个液冷芯片,可提供令人难以置信的 42.5 百万兆次浮点运算,甚至超过了目前世界顶级的超级计算机 El Capitan 24 倍。它的 SparseCore 升级、每个芯片 192GB 的 HBM 和 1.2 Tbps 的芯片间网络创造了一个低延迟、高带宽的网格,针对大型语言模型和科学模拟的分布式需求进行了优化。
但也许最值得注意的是,Ironwood 的 每瓦性能是其前身的 2 倍,并且 比 2018 年的 TPU v1 效率高近 30 倍,这种架构上的飞跃标志着大规模 AI 部署在经济和环境上的新可行性。
一位云分析师指出:“你看到的是一个可以跨模态、实时地维持对数万亿个 token 进行推理的系统——并且以一半的能源成本做到这一点。这不仅仅是性能,而是战略杠杆。”
Agent2Agent:解决 AI 最紧迫的集成问题
当 Ironwood 展示原始计算能力时,谷歌的 Agent2Agent 协议解决了另一个问题:代理通信。今天发布的 A2A 得到了包括 Salesforce、SAP、PayPal 和 Deloitte 在内的 50 多家企业合作伙伴的支持,它引入了一个开放协议,允许 AI 代理跨孤立的系统、框架和供应商协调任务和交换上下文。
Agent2Agent 的核心在于解决一个长期存在的行业难题:如果每个 AI 工具都在自己的围墙花园中运行,它们如何协同工作以解决端到端的业务问题?
A2A 构建于 HTTP、JSON-RPC 和 SSE 之上,其开源设计遵循五个指导原则:默认安全架构、支持具有反馈回路的长任务、模态无关的消息传递(文本、视频、音频)以及完全的代理自主性,无需依赖工具。诸如用于能力发现的 Agent Cards 和 任务生命周期 等关键功能为复杂的协作提供了结构。
一个引人注目的用例?招聘。经理可以安排一个 AI 助手来寻找候选人。该代理会与专门的寻源代理互动,安排面试,管理反馈回路,并运行合规性检查——所有这些都通过 A2A 支持的代理间消息传递实现。
分析师认为,长期影响可能比单纯的生产力提升更深远。
Vertex AI 生成媒体:一个平台,所有模态,企业级
当 Ironwood 为后端提供支持,Agent2Agent 编排工作流程时,Vertex AI 扩展的生成媒体套件使企业能够从文本提示中创建、品牌化和交付体验。
最引人注目的新增功能是 Lyria,这是一个文本到音乐模型,可以跨流派生成高保真、情感细腻的音频。企业已经利用它来用与广告活动情绪和叙事相符的 自定义、免版税的配乐 替换素材库。
与此同时,Veo 2 引入了电影视频生成,并提供 修复、外绘 和相机路径控制等编辑工具——为代理机构提供了新的创意指导水平。Chirp 3 只需 10 秒的输入即可实现 自定义语音克隆 和区分说话人功能,从而解锁了在可访问性、品牌推广和音频分析方面的新用途。Imagen 3 改进了图像生成的细节、光照和对象移除,从而加强了谷歌对专业级视觉内容的承诺。
至关重要的是,每个输出都受企业安全功能的约束:
- 用于可追溯性的 SynthID 水印
- 阻止有害提示的 安全过滤器
- 保护客户训练数据的 数据治理
- 保护企业免受版权索赔的 IP 赔偿
战略综合:超越各部分之和的愿景
使这三重奏不仅仅是三个令人印象深刻的发布的原因在于它们之间的 哲学连贯性。每项产品的设计不仅是为了在孤立的环境中超越竞争对手,而且是为了作为一个 互锁系统 运行:
- Ironwood 为实时模型服务提供可扩展的、推理优化的骨干。
- Agent2Agent 使由这些模型驱动的自主代理能够在系统之间流畅地运行。
- Vertex 生成媒体 提供创造性的有效载荷,将智能转化为输出——即时且大规模。
这个堆栈不仅仅是技术升级。这是一份宣言:人工智能应该是主动的、可组合的和企业安全的。它应该代表你跨平台行动。它应该毫无摩擦地创造。它应该在不损害能源、伦理或集成的情况下做到这一点。
在一个充斥着封闭生态系统和狭隘解决方案的市场中,谷歌云的模块化、开放和可扩展的方法很可能成为下一波 AI 原生企业的首选基础设施层。
一位独立的 AI 研究人员观察到:“他们构建的不是一个产品,而是一个企业 AI 经济的操作系统。”
最后的话:基础设施的一项突破,但真正的革命并非发生在企业中
虽然谷歌的公告在技术上令人印象深刻(至少从自我宣称的公关稿来看)——从 Ironwood 的推理优化架构到 Agent2Agent 的优雅开放性,再到 Vertex 的端到端生成能力——但我们仍然怀疑这些进步是否会在传统企业环境中推动短期转型。
事实上,我们认为真正的创新正在其他地方展开:消费者、创作者和 LLM 原生初创公司正在企业组织之外构建产品。正如 Andrej Karpathy 所观察到的,这可能是第一个颠倒通常的自上而下采用曲线的变革性技术——在公司或政府完全吸收其潜力之前,为个人提供指数级的价值。
今天的 AI 堆栈,无论多么复杂,仍然面临着相同的企业摩擦:遗留系统、合规性开销、品牌护栏和风险规避。对于大型组织而言,即使是最好的工具也往往只是使他们以渐进的方式更好地完成他们已经在做的事情,我们坚信这并不是未来的发展方向。