AI 时代的数据通信创新

Coherent 高意如何为打造下一代数据中心推动人工智能和机器学习的创新。

Julie Sheridan Eng 博士

首席技术官

 

2023 年 6 月 23 日,作者:Coherent高意

ai-era-header.jpg

在收发器的世界中,唯一不变的就是变化 — 由于人工智能的进步,我们正处于一场根本性变革的早期阶段。

我刚刚度过了与 Finisar/II-VI/Coherent 合作的 20 周年纪念日。你们中很多人都知道,Finisar(现为 Coherent 高意)是可插拔收发器领域的先驱,以至于 Finisar 这个名字几乎成为了收发器的代名词。

从电信网络到企业数据中心,再到 Web 2.0 超大规模服务器,由于关键市场驱动因素的演进和革命性变化,过去二十年行业发生了巨变。

今天,我们正在见证另一个重大的市场转变,即人工智能 (AI) 和机器学习 (ML) 的迅猛增长。这些应用将定义光收发器故事的新篇章 — 我们已经在 Coherent 高意写下了这一篇章。

这是一个重要的故事,因为收发器是我们生活的现今世界中一个看不见的重要部分。不管我们是否意识到,我们大多数人每天都在使用光纤网络和收发器。

一个简单的例子就是使用搜索引擎。您是否想过,从输入搜索查询到返回结果,中间发生了什么?搜索查询到达数据中心,然后通过光纤网络返回,平均要经过数百英里。在数据中心内,单个搜索查询使用数百台计算机来检索答案,而这些计算机用光纤连接在一起。光收发器执行将电信号与光信号来回转换的重要功能。因此,如果您今天进行搜索,就会使用光纤网络,并且信号很可能通过 Coherent 高意的收发器传输。

 

为什么 AI 创新需要网络创新

我们来从市场角度入手。

我相信我们大多数人都读过关于 OpenAI ChatGPT、Google Bard 或 Microsoft Bing 的文章,或者亲自使用过它们。事实上,OpenAI 的 ChatGPT 被称为历史上增长最快的应用程序,仅两个月时间用户量就达到了 1 亿。

但您可能会问,这与收发器有什么关系?

AI 必须在现有数据集上进行训练,而该数据集可能包含数十亿个参数。这需要强大的计算能力,而这些计算能力分布在数万个处理器上。为了满足这些新要求,数据中心要从根本上进行重新架构,并添加专门用于 AI 和 ML 的服务器和网络设备。

网络前端(第 1 级)仍然是连接到枝叶/架顶式 (ToR) 交换机的主干交换机的传统架构。网络的新加速计算部分(0 级或后端)由 AI/ML 服务器和加速计算设备组成,与传统计算和存储一起连接到传统网络。该网络的各个级别都使用包括收发器在内的光学互连。 

 

ai-era-figure-1.jpg

图 1: AI/ML 服务器及其连接结构,以及传统计算和存储服务器的连接,增加了数据中心的光链路数量。

 

收发器的速度对于网络性能至关重要。为解决人工智能和机器学习问题而进行的网络变革,正在推动我们和其他同行比以往更快的速度推出更高速的收发器。仅在 20 年前,光收发器的最高数据速率为 10G。如今,Coherent 高意超过 50% 的数据通信收入来自 200G 和更高数据速率的收发器。在日益增长的 AI/ML 应用需求的推动下,800G 收发器已投入生产,我们预计首批 1.6T 收发器将在未来几年内上市。五年内,800G 和 1.6T 数据通信收发器的市场机会,预计将超过所有其他类型数据通信收发器的总和,而这主要是由 AI 和 ML 驱动的。

在 Coherent 高意,我们已经拥有符合 AI 和 ML 要求的完整收发器产品组合。这些收发器不受协议限制,这意味着相同的收发器硬件可以支持以太网和无限带宽,以及 AI 和 ML 的专有协议,例如 NVIDIA 的 NVLink。市场上普遍认为 Coherent 是此类收发器及其核心技术的专家。

 

垂直整合 → 快速创新 → 更快的收发器

要想通过提高收发器的速度来满足这一需求,就需要以极快的速度进行创新。我们该怎么做呢?

多年来,我们进行了多项战略投资,实现了无与伦比的垂直整合水平。我们不仅在内部设计和制造收发器,还设计和制造许多组件,包括激光器探测器无源光学器件。在设计需要新组件的新收发器时,我们要么从我们的重要开发合作伙伴之一采购该组件,要么在内部设计和制造。我们根据商业案例、上市时间和战略考虑来决定哪些组件在内部开发以及哪些组件与供应商一起开发。

 

ai-era-figure-2.jpg

图 2: Coherent 高意内部开发了许多收发器组件。 上图: Coherent 高意开发的集成电路。

 

用尖端数据通信技术连接世界

作为 CTO,我曾领导我们的数据通信收发器工程 15 年。请容我慢慢解释,我们如何使用垂直集成(特别是一系列尖端激光技术)打造市场需求越来越大的 800G 和 1.6T 收发器。

800G 和 1.6T 收发器需要速率达到每通道 100G 和 200G 的激光器。所使用的激光器类型由数据速率和光纤链路长度决定。一般来说,网络的 AI/ML 结构部分(0 级)中的互连小于 50 m,将 ToR 交换机连接到主干交换机(1 级)的互连长达 500 m,将交换机连接到路由器或将路由器连接到路由器的互连(电信接入)距离在 2 到 10 公里之间。这些距离和应用中的每一个都可以通过不同的激光技术得到良好满足。

 

ai-era-figure-3.jpg

图 3: 位于加利福尼亚州弗里蒙特的 Coherent 高意收发器研发实验室。

 

对于小于 100 m 的链路距离(包括 0 级互连和 1 级互连的子集),我们使用垂直腔表面发射激光器 (VCSEL)。这些激光器基于我们的砷化镓 (GaAs) 技术平台。VCSEL 解决方案的成本和功耗通常都是极低的,是 100 m 以下连接的首选激光器。我们可以看到 AI/ML 应用对基于 VCSEL 的收发器都有巨大需求。 

Coherent 高意在美国和欧洲拥有多个 6 英寸 GaAs VCSEL 工厂。我们是全球产量最大的 VCSEL 制造商之一,为数据通信和消费应用交付大量 VCSEL。我们的单通道速率 100G 的 VCSEL 已投入生产,以支持 400G 和 800G 收发器。我们正在研究单通道速率 200G 的 VCSEL,这需要对 VCSEL 器件设计和制造进行重大更改。

 

ai-era-figure-4.jpg

图 4: 以 6 英寸砷化镓晶圆为基板制造的高速 VCSEL。

 

对于距离大于 VCSEL 支持距离的 1 级交换以及电信接入,需要使用单模设备。这些设备由磷化铟 (InP) 材料制成。Coherent 高意在美国和欧洲拥有多家 InP 晶圆厂。我们的 InP 技术平台是业内极少数经过大规模现场验证的平台之一:在过去二十年中,我们现场部署了超过两亿台数据通信激光器。我们的激光器已经过世界上几乎所有网络 OEM 和 Web 2.0 的认可和部署,而且我们利用丰富的经验来开发激光器以支持单模 800G 和 1.6T 收发器。

对于大于 100 m 的 1 级链路距离,可以使用基于硅光子的收发器。所有硅光子产品都需要 InP 连续 (CW) 激光器来产生光。我们正在将这些激光器推向市场,并计划将它们用于我们自己的收发器设计,例如我们在 2022 年 9 月的欧洲光通信会议 (ECOC) 上展示的基于硅光子的 800G-DR8 收发器。

对于大于 100 m 的 1 级链路以及电信接入 (2 – 10 km),可以使用电吸收调制激光器(或简称 EML)。我们制造单通道速率 100G 的 EML 以支持 400G 和 800G 收发器,例如我们基于 EML 的 800G DR8 收发器,我们也在 2022 年的 ECOC 上展示了该收发器。同样在 ECOC 上,我们推出了单通道速率 200G 的 EML,并因此获得了光通信年度创新大奖

虽然我们有望实现单通道速率 200G 的收发器,但是即使我们使用 EML,实现 10 公里的传输距离也是一个重大挑战。对于该应用,我们对称为 DFB-MZ 的新近突破性激光技术寄予了很大期望,这意味着我们可以打造出具有 Mach Zehnder 干涉仪的分布式反馈激光器。这是一种与 InP Mach Zehnder 调制器单片集成的 InP 连续激光器。该激光技术将使 1.6T 收发器的传输距离达到 10 公里。这绝对是先进的单通道 200G 激光技术。

 

ai-era-figure-5.jpg

图 5: Coherent 高意在 OFC 2023 上展示了 200G PAM4 单片集成分布式反馈激光器-Mach Zehnder 调制器技术。

 

我们的承诺:在 AI 时代推动创新

毫无疑问,我们正在进入人工智能的时代。事实上,我们已经身处其中。在 Coherent 高意,我们承诺不断创新,通过我们的突破性技术助力客户定义未来。

二十多年来,作为数据通信收发器的领导者之一,我们期望继续创新,成为技术引领者,并向客户提供批量解决方案,使数据中心能够满足他们的需求。我们很高兴能够与合作伙伴一起提供硬件解决方案,帮助发挥人工智能和机器学习的力量。无论您相信与否,虽然我已经在这个领域工作了 20 年后,我仍然一如既往地在这个快节奏且影响重大的光通信世界中工作,并且和以前一样生气勃勃。

如需了解更多信息,请访问 www.coherent.com/zh 并关注我们的微信公众号:Coherent 高意。

“在 Coherent 高意,我们已经拥有符合 AI 和 ML 要求的完整收发器产品组合。这些收发器不受协议限制,这意味着相同的收发器硬件可以支持以太网和无限带宽,以及 AI 和 ML 的专有协议,例如 NVIDIA 的 NVLink。业界普遍认为 Coherent 高意是此类收发器及其核心技术的专家。”
cto-julie-sheridan-eng-pr.jpg