光学革命内幕:nEye Systems 与重塑 AI 数据中心的竞赛
一家由 Alphabet、微软、英伟达和美光支持的加州大学伯克利分校衍生公司,正在挑战人工智能基础设施的电力基础——如果它赢了,真正的赌注是什么。
硅谷光学竞赛中涌现的新竞争者
在海湾边缘一栋低矮建筑的无菌、湿度受控的实验室中,一小群工程师正准备挑战一个计算领域沿用了几十年的公理:数据必须通过电力传输。nEye Systems 是一家由加州大学伯克利分校的学者创立的光子学初创公司,已筹集了 7250 万美元的风险投资,目标只有一个——一次一个光子地重塑人工智能计算的基础。
在这个微秒必争、电费高达数亿美元的行业中,这家初创公司声称,它可以用晶圆级、MEMS 驱动的光学电路开关取代当今带宽受限、耗能巨大的电子开关——提供快 10,000 倍的速度和低 1,000 倍的功耗。
他们的方案说服了科技生态系统中一些最具战略地位的投资者。Alphabet 的 CapitalG、微软的 M12、英伟达和美光创投现在正将赌注押在 nEye 全光数据中心核心的宏伟愿景上。
但在风险投资头条新闻背后,隐藏着一个更深层次的故事——一个硅光子学从实验室实验走向工业革命的故事,以及超大规模计算面临物理和经济限制时,一场高风险的棋局。
AI 核心的能源危机
生成式人工智能和大规模机器学习的兴起,极大地推动了对高性能计算基础设施的需求。仅在 2024 年,谷歌、亚马逊和微软等超大规模企业就将其 GPU 集群规模扩大了一倍。然而,随着每一次扩张,一个熟悉的问题变得更糟。
一位资深的云基础设施分析师指出:“这些系统不再受计算能力的限制——而是受芯片之间数据移动速度和效率的限制。电子开关在带宽和功耗方面都遇到了瓶颈。”
传统的交换架构是几十年前为以 CPU 为中心的工作负载设计的,现在难以处理当今以 GPU 为主的多机架集群。每一次光电转换都会增加延迟并消耗能量,而错综复杂的多层交换结构通常将 GPU 的利用率限制在 60% 以下。
这就是 nEye Systems 正在瞄准的痛点:人工智能工厂内部看不见但却令人瘫痪的瓶颈。
晶圆级光子学:从实验室演示到数据中心结构
nEye 的解决方案是什么?一种可编程的晶圆级光学电路开关,采用 MEMS(微机电系统)和硅光子技术构建。该公司的“SuperSwitch”在加州大学伯克利分校 Ming Wu 教授的实验室中经过十多年的开发,使用直接光学链路连接数千个 GPU 和内存单元——无需转换、无需产生大量热量的铜缆、无需传统网络。
这不仅仅是理论上的。根据与投资者分享的内部基准测试,SuperSwitch 具有以下优势:
- 比现有的光学交换机架小 100 倍,
- 能效提高 1,000 倍,
- 重构速度提高 10,000 倍,并且
- 按每比特交换计算,比传统解决方案便宜 10 倍。
这种紧凑的外形尺寸为将交换机放置在机架内部打开了大门——展平了网络层,提高了容错能力,并从根本上提高了 GPU 到 GPU 的吞吐量。
正如一位熟悉该交易的风险合伙人所说:“这不是一个更好的交换机。这是对网络结构的完全重新构建。”
战略资本:当投资变成地缘政治博弈
这种重构并没有被 nEye 背后的战略支持者们忽视。Alphabet 的 CapitalG 正在领投 B 轮融资,注资 5800 万美元,紧随其后的是 M12、英伟达和美光——它们都为该项目带来了现金以外的东西。
英伟达的 GPU 在现代 AI 工作负载中占据主导地位,它有直接的动机来消除降低 GPU 利用率的瓶颈。微软通过 Azure 在云 AI 可扩展性方面投入了大量资金。全球内存供应商美光看到了将其业务扩展到数据移动领域的机会。
但也许最能说明问题的信号是,谷歌也在悄悄地并行开发光学可重构 AI 超级计算机——这表明 nEye 的核心论点不仅可信,而且具有战略意义。
一位资深技术投资者表示:“精明的资金正在围绕这样一种观念整合:光学交换不是一个利基市场。它是超大规模架构不可避免的下一步。”
真正的战场:制造,而不是摩尔定律
尽管如此,大胆的主张和强大的盟友并不能保证成功。从大学实验室到生产工厂的过渡过程中充满了牺牲品。
一位曾为光子芯片放大提供咨询的制造顾问表示:“制造原型与大规模生产不同。基于 MEMS 的光学开关具有严格的公差。晶圆级良率是一个严峻的挑战。”
良率问题、封装复杂性和与现有基础设施的集成都是可能延迟 nEye 商业首秀或完全使其脱轨的障碍。
此外,还有标准问题。光学交换缺乏一套通用的 API、控制协议和集成工具包。在这些问题得到解决之前,大规模采用对于规避风险的运营商来说仍然是一场赌博。
正如一家大型云提供商的系统架构师所说:“从纸面上看,它很棒。但如果不破坏 SLA,将如此激进的东西集成到生产中并非易事。”
竞争升温,但差异化依然强劲
在追求光学互连方面,nEye 并不孤单。Lightmatter、Ayar Labs、DustPhotonics 和 Celestial AI 等初创公司正在竞相将硅光子开关和链路的变体商业化。有些公司专注于芯片到芯片的互连,另一些公司则专注于机架级光学结构。
但很少有公司能提供 nEye 这样的高基数、可重编程的晶圆级交换能力,以及极高的能源效率。大多数竞争对手仍在与离散模块打交道,或者需要笨重的外部光学器件。
一位光子学分析师指出:“真正的差异化在于它们的集成密度和可重构性。如果他们能够交付他们所声称的东西,这将是一种具有品类定义意义的产品。”
这是一个很大的“如果”。但它已经引起了现有企业的严重关注——并且可能会为未来的收购或知识产权争夺战奠定基础,因为市场正在成熟。
炒作与实际应用:灯光真的亮了吗?
到目前为止,nEye 尚未宣布任何付费客户、签署试点项目或公开部署系统。该公司在生产时间表方面仍保持低调,但接近董事会的消息人士表示,有限的抽样可能会在年内开始。
这使得目前的实际应用最好被描述为势头强劲,验证不足。该团队已经从顶尖风险投资公司筹集了资金,建立了一支令人印象深刻的技术专家队伍,并阐明了明确的产品愿景。但市场仍在等待证据。
跟踪该行业的分析师仍然持谨慎乐观态度。
一位分析师表示:“从一个酷炫的交换机到重新构建的超大规模数据中心,还有很长的路要走。但他们正在解决正确的痛点,而且有正确的人在支持他们。这是你不能忽视的。”
高风险的未来:如果 nEye 获胜,会发生什么变化?
如果 nEye Systems 成功地将其 SuperSwitch 推向大众市场,那么由此产生的连锁反应可能是巨大的。
超大规模云平台可以重新设计集群,使其在光学上是扁平的,从而大大降低能源消耗和热密度。AI 训练时间可以显着缩短,从而加快模型迭代。资本支出可以从各层传统的交换硬件转移到更少、更密集的光学平面。
更耐人寻味的是,如果生产成本下降得足够快,光学交换可以从超大规模企业向下渗透到边缘和企业 AI 系统——缩小大型科技公司和其他公司之间的性能差距。
对于投资者来说,这可能会引发一场新的光子硅集成竞赛,从而引发收购、晶圆厂投资和标准化努力,类似于我们在移动 GPU 或 AI ASIC 早期所看到的情况。
但另一方面也是同样如此:如果放大规模的过程被证明难以实现,或者资金更充足的竞争对手以更成熟的制造工艺实现飞跃,那么 nEye 的美好愿景可能会沦为光子学历史中的一个脚注。
光子策略
在 AI 基础设施残酷的物理定律中,节省的每一瓦特和缩短的每一微秒都很重要。nEye Systems 大胆押注,光子而不是电子才是大规模数据移动的未来——并且它可以以芯片大小、可重编程的封装形式交付该未来。
该公司拥有技术血统、顶尖投资者的支持以及可以重新定义数据中心连接方式的产品路线图。但它也面临着经典的硬件创业公司的熔炉:要么扩大规模,要么死亡。
如果它成功了,它将不仅仅是另一个深度科技退出。它将标志着一个新架构时代的开始——在这个时代,光学交换不是一个特性,而是 AI 本身的基础。
在那之前,Emeryville 的灯光亮着——整个行业都在密切关注。