1.8亿美元的豪赌:Retym 能否重新定义数据中心互连的未来?
AI 基础设施中无人提及的瓶颈
现在每次讨论 AI,大家都会想到 GPU 不够用、模型太大、人才难找这些问题。但在这些热门话题下面,AI 基础设施的“水管”里,也就是在芯片、服务器和数据中心之间传递大量数据的网络里,正悄悄出现一个问题。这些互连技术正受到 AI 工作负载的巨大压力,逐渐成为新的瓶颈。
Retym 是一家半导体初创公司,刚刚获得了 1.8 亿美元的投资,并带着一个大胆的目标进入市场:改变 AI 数据中心的通信方式。Retym 得到了 Spark Capital、Kleiner Perkins、Mayfield 和 Fidelity 的支持,他们认为 Retym 的可编程相干 DSP(数字信号处理)芯片将解决限制 AI 增长的带宽和效率问题。
但在 Marvell 和华为这样实力雄厚的巨头主导的市场中,一家初创公司真的能有所作为吗?
为什么 AI 基础设施市场适合颠覆
需求飞涨,传统技术落后
据 Dell’Oro Group 预测,未来十年,全球数据中心计算和网络方面的年度支出将超过 1 万亿美元。罪魁祸首是什么?是需要超高带宽和超低延迟的 AI 工作负载。生成式 AI 和大规模机器学习模型的爆发式增长正在将数据中心的架构推向极限——不是计算能力,而是节点之间数据传输的速度。
AI 驱动的全球数据中心支出预计增长概要
指标 | 时间段 | 预计价值/增长 | 主要驱动因素/说明 | 来源 |
---|---|---|---|---|
全球数据中心资本支出 | 2029 年 | 超过 1 万亿美元 | AI 基础设施、超大规模企业、政府计划。 | Dell'Oro Group |
全球数据中心资本支出复合年增长率 (CAGR) | 到 2029 年 | 21% | AI 基础设施支出。 | Dell'Oro Group |
用于 AI 的加速服务器 | 2029 年 | 几乎占基础设施支出的一半 | 专注于 GPU、用于 AI 工作负载的定制加速器。 | Dell'Oro Group |
全球数据中心网络市场 | 2024年 | 376 亿美元 | 物联网、大数据、5G、可扩展网络。 | IMARC Group |
全球数据中心网络市场 (2029) | 2029 年 | 642 亿美元 | 以 11.3% 的复合年增长率增长;SDN、NFV、边缘计算。 | IMARC Group |
全球 AI 数据中心市场 | 2024 年 vs 2032 年 | 从 151.3 亿美元增长到 940.3 亿美元 | 以 25.7% 的复合年增长率增长;由 AI、云计算、大数据驱动。 | Fortune Business Insights |
用于 AI 的以太网网络适配器复合年增长率 | 到 2029 年 | 40% | 支持 AI 计算集群增长。 | Dell'Oro Group |
全球数据中心电力需求复合年增长率 | 2023 年 - 2028 年 | 约 16%(到 2028 年约为 130 吉瓦) | 传统工作负载、GenAI、高性能计算。 | BCG |
AI 数据中心能源消耗复合年增长率 | 到 2027 年 | 44.7%(到 2027 年约为 146.2 太瓦时) | AI 工作负载需求激增。 | IDC |
加速计算支出 | 2028 年 | 超过 2000 亿美元 | 超大规模企业引领投资;加速服务器占部署的 20% 以上。 | Dell'Oro Group |
对于长距离互连(10-120 公里)来说,挑战尤为严峻,它是连接超大规模数据中心和云区域的骨干。目前的解决方案难以在这些距离上保持性能和能效。
这就是由先进 DSP 驱动的相干光通信发挥作用的地方。
相干 DSP:关键但被忽视的部分
用于相干光通信的数字信号处理器对于编码、传输和解码光纤链路上的高速数据至关重要。随着 AI 模型越来越大,分布式训练成为常态,在更远的距离上保持信号完整性变得更加复杂,也更加重要。
相干光通信是一种先进的光通信方法,它使用光的相位和偏振等特性,而不仅仅是强度来提高数据容量。必要的数字信号处理器 (DSP) 负责处理编码、解码和纠正这些信号的复杂任务,从而实现光纤上的高速、长距离传输。
Retym 专注于解决这个痛点。
Retym 的优势:为 AI 规模网络设计的可编程 DSP
随着 Retym 正式发布,它不仅展示了自己的技术,还展示了在一个技术要求最高的半导体领域竞争的策略。
以下是它的独特之处:
1. 可编程性优于固定功能
与传统的固定功能 DSP 不同,Retym 的芯片是可编程的,这意味着可以通过软件进行定制,以满足特定的工作负载要求、网络条件或不断发展的 AI 架构。这可以提供传统解决方案难以匹敌的运营灵活性。
2. 大规模能效
能源消耗是超大规模数据中心最大的成本驱动因素之一。Retym 的芯片经过精心设计,可在最大限度地减少功耗的同时提供高吞吐量,这对于寻求更环保的 AI 基础设施的云提供商来说是一个关键优势。
3. 由深厚的领域专家构建
Retym 由 Sachin Gandhi 共同创立,汇集了模拟、DSP、VLSI 和光学系统领域的领先专家。凭借 Syed Ali(一位经验丰富的半导体企业家)等董事会成员以及精英风险投资公司的支持,该团队兼具技术和战略深度。
4. 先进制造
Retym 利用 台积电的 5 纳米工艺节点,从而实现尖端性能和小型化。这对于满足下一代 AI 集群的严格延迟和带宽需求至关重要。
投资者押注的是什么
Retym 筹集了 1.8 亿美元的资金(其中由 Spark Capital 领投的 D 轮融资为 7500 万美元),这不仅仅是资金。这表明了一些最受尊敬的风险投资公司的信心。
- Spark Capital 的 James Kuklinski 现在是董事会成员,他认为 Retym“具有独特的优势来满足扩展 AI 工作负载的需求”,并强调了性能和规模的重要性。
- Mayfield 的 Navin Chaddha 称该团队为“卓越的创新者”,并将 Retym 的工作视为“定义类别”,尤其是在AI 驱动的互连方面。
- Kleiner Perkins 的 Mamoon Hamid 指出,当前的基础设施限制是 AI 创新的主要瓶颈,而 Retym 正在直接解决这个问题。
这笔资金将用于扩大生产、扩大合作伙伴关系以及继续公司的多代产品路线图——这表明 Retym 并非着眼于短期。
市场格局:机遇与激烈竞争并存
虽然 Retym 的价值主张引人注目,但未来的道路绝非易事。
由巨头主导
Marvell、Infinera 和 华为 等公司拥有深厚的客户关系、端到端产品套件和显着的先发优势。特别是 Marvell,通过自身发展和收购(例如 Inphi)在相干 DSP 领域占据主导地位。
集成障碍
相干 DSP 很难集成到光学系统和收发器中。赢得与 OEM 和超大规模企业的早期设计机会对于获得吸引力至关重要。
验证是关键
到目前为止,Retym 的芯片正在测试和预生产中。市场采用将取决于它们的性能在实际部署中与既定基准的匹配程度(或超过程度)。如果没有早期的客户胜利,即使是最优雅的芯片设计也难以获得进展。
风险、挑战和战略转折点
1. 技术证明 早期的基准测试和第三方验证将决定投资者和客户的信心。围绕可编程性和节能性的声明需要转化为可量化的收益。
2. 生态系统适应性 半导体创新并非孤立地取得成功。Retym 必须确保 OEM 合作伙伴关系、与收发器供应商保持一致,并确保与更广泛的光学网络堆栈的兼容性。
在半导体行业中,“设计获胜”是指组件供应商(如芯片制造商)说服原始设备制造商 (OEM) 选择其特定部件用于 OEM 的产品设计。获得这些设计获胜至关重要,因为它们通常会在 OEM 的产品投入批量生产时转化为可观的未来销售额。
3. 上市执行 这个领域的销售周期很长,数据中心运营商的转换成本也很高。Retym 必须驾驭复杂的销售流程,并从第一天起就证明集成的价值。
在高风险、高回报中押注 AI 基础设施的未来
Retym 并不是第一家挑战技术领域根深蒂固的参与者的初创公司,但很少有人会选择如此高风险的战斗。该公司对可编程、节能相干 DSP 的方法直接解决了 AI 基础设施日益增长的难题。
如果它能够证明自己的技术、建立战略合作伙伴关系并赢得超大规模企业或主要 OEM 的早期胜利,那么它就可以在万亿美元的市场中占据一席之地。如果不能,它可能会面临许多半导体挑战者的命运:伟大的技术永远无法突破。
机会是真实的。挑战是巨大的。未来 12-18 个月对于确定 Retym 是会取得突破性的成功,还是会成为深科技雄心中的警示故事至关重要。