在今年的光纖通信會(huì)議(OFC)會(huì)議上,光電共封(CPO)成為芯片廠商的一大熱議話題,博通、Marvell介紹了各家的采用光電共封裝技術(shù)的51.2Tbps的交換機(jī)芯片,思科也展示了其CPO技術(shù)的實(shí)現(xiàn)可行性原理,在光電共封技術(shù)的支持下,一個(gè)交換機(jī)的新時(shí)代正在來臨!這對(duì)于光電共封技術(shù)來說是一個(gè)很大的進(jìn)步,也足以表明利用光來移動(dòng)數(shù)據(jù)的前景確實(shí)是光明的。
這個(gè)賽道也成為了芯片巨頭的新戰(zhàn)場(chǎng)。
光電共封迎來大的推動(dòng)力
這一波的光電共封器件很大的推動(dòng)者是數(shù)據(jù)中心的公有云供應(yīng)商,隨著AI/ML(人工智能/機(jī)器學(xué)習(xí))、高分辨率視頻流和虛擬現(xiàn)實(shí)等更高帶寬應(yīng)用的出現(xiàn),網(wǎng)絡(luò)流量持續(xù)增長(zhǎng),數(shù)據(jù)中心網(wǎng)絡(luò)承受的壓力也在不斷增加,諸如谷歌、Meta、亞馬遜、微軟或阿里巴巴等,他們每家都部署了數(shù)萬臺(tái)交換機(jī),而且正在推動(dòng)數(shù)據(jù)速率從100GbE向400GbE和800GbE更高速的數(shù)據(jù)鏈路的方向發(fā)展,這將消耗更多的電力來通過銅纜傳輸數(shù)據(jù)。
作為交換機(jī)的大腦——交換機(jī)芯片,在過去多年來主要有兩大長(zhǎng)期發(fā)展趨勢(shì):
一,大約每?jī)赡暌淮?,交換機(jī)芯片的帶寬會(huì)翻一番,這也很好的遵循了摩爾定律。
二,為了支持總交換機(jī)芯片帶寬的增加,Serdes的速度、數(shù)量和功率也在隨之增加,SerDes的速度從10Gbit/sec增加到112Gbit/sec,芯片周圍的SerDes數(shù)量從64通道增加到51.2Tbps一代的512通道。SerDes功率成為系統(tǒng)總功率的很大一部分。
當(dāng)下交換機(jī)之間所采用的方案大都是可插拔的光學(xué)器件,雖然可以很容易地更換或換成更高容量的,但這也意味著在交換機(jī)芯片和光學(xué)器件接口之間有幾英寸的銅,而且由于所需的電氣和光學(xué)密度、熱問題和功耗,當(dāng)前可插拔光學(xué)器件也面臨著容量難擴(kuò)展的制約。于是,業(yè)界開始探索提高數(shù)據(jù)中心效率的新方法,光電共封(CPO)成為一個(gè)有利的選擇!
光電共封裝(Co-PackagedOptics,簡(jiǎn)稱CPO)是一種新型的光電子集成技術(shù),它將光學(xué)器件(如激光器、調(diào)制器、光接收器等)封裝在芯片級(jí)別上,直接與芯片內(nèi)的電路相集成,借助光互連以提高通信系統(tǒng)的性能和功率效率。共同封裝光學(xué)器件的一項(xiàng)關(guān)鍵創(chuàng)新是將光學(xué)器件移動(dòng)到離SwitchASIC裸片足夠近的位置,以便移除這個(gè)額外的DSP(見下圖)。借助CPO,網(wǎng)絡(luò)交換機(jī)系統(tǒng)中的光接口從交換機(jī)外殼前端的可插拔模塊轉(zhuǎn)變?yōu)榕c交換機(jī)芯片組裝在同一封裝中的光模塊。
基于這種封裝模式,光電共封(CPO)技術(shù)的優(yōu)勢(shì)盡顯:
增強(qiáng)性能:CPO可以將光學(xué)元件直接嵌入芯片中,使得光學(xué)元件與芯片內(nèi)部電路的距離更近,減小了電信號(hào)的延遲和失真,提高了通信系統(tǒng)的性能。
節(jié)省空間:CPO可以大大減小光模塊的尺寸,尤其是在高密度數(shù)據(jù)中心環(huán)境下,可以將更多的端口裝在相同大小的機(jī)柜中。
降低功耗:CPO可以減少能量轉(zhuǎn)換的步驟,從而降低了功耗。與傳統(tǒng)的光模塊相比,CPO在相同數(shù)據(jù)傳輸速率下可以減少約50%的功耗。
提高可靠性:CPO可以提高光學(xué)和電子之間的互聯(lián)可靠性,并減少外部干擾。同時(shí),由于CPO是在芯片級(jí)別上封裝的,所以也能夠提高整個(gè)系統(tǒng)的可靠性。
降低成本:CPO可以減少芯片與光模塊之間的連接器數(shù)量,從而降低了生產(chǎn)成本。此外,CPO的小尺寸和低功耗也能夠降低運(yùn)營(yíng)成本。
正因?yàn)榇?,使得越來越多的芯片廠商、光通信廠商和研究機(jī)構(gòu)都在積極研究和使用光電共封技術(shù)。
CPO的商業(yè)化雛形,在交換機(jī)市場(chǎng)中顯現(xiàn)
博通
博通(Broadcom)涉足光電領(lǐng)域大約在1990年,1995年,Broadcom推出了其第一款光電收發(fā)器,這是該公司進(jìn)入光電領(lǐng)域的開端。此后博通進(jìn)行了一系列收購(gòu),1998年收購(gòu)了光通信設(shè)備制造商Epigram;2000年,Broadcom收購(gòu)了另一家光通信設(shè)備制造商Luminent;2016年,Broadcom收購(gòu)了從事光電器件和模塊研發(fā)的BroadLight。
可以說,通過不斷收購(gòu),高通進(jìn)一步加強(qiáng)了其在光電領(lǐng)域的研發(fā)能力,博通也開發(fā)出了電子、光學(xué)和創(chuàng)新封裝架構(gòu)(SCIP?)。養(yǎng)兵千日,如今,博通正將其在光電領(lǐng)域的技術(shù)積累應(yīng)用到交換機(jī)產(chǎn)品中。
博通在2023年光纖通信會(huì)議(OFC)上談到了其最新的交換機(jī)產(chǎn)品——BroadcomTomahawkStrataXGS5,它在單個(gè)單片芯片中提供51.2Tbps的以太網(wǎng)交換容量。如下圖所示,該交換機(jī)值得一提的地方是,Tomahawk5采用了光電共封裝的技術(shù),它將交換機(jī)芯片和100GPAM4接口共同封裝在一起,這種新芯片能夠減少將信號(hào)驅(qū)動(dòng)到交換機(jī)前端的可插拔光學(xué)器件的需求,大大降低了功耗。相比于Tomahawk4Humboldt25.6T6.4W的功率,該交換機(jī)僅需要5.5W的功率為800Gbps的流量供電。博通稱,由于采用了光電共封(CPO)的光學(xué)技術(shù),該芯片能將光學(xué)連接所需的功率降低50%以上。
51.2Tbps交換機(jī)中有一個(gè)新的交換芯片,這是一款5nm工藝的單片芯片,它搭載了六個(gè)Arm處理器核心,交換機(jī)上還支持VxLAN單通道以及PTP和SyncE等特性,可提供多達(dá)64個(gè)800GbE、128個(gè)400GbE、256個(gè)200GbE或512個(gè)100GbE鏈路。實(shí)際上,這些交換芯片是為了100GbE以上速率的交換機(jī)而設(shè)計(jì)的。博通表示,一臺(tái)新的Tomahawk5交換機(jī)可以有效地取代48臺(tái)2014年代的Tomahawk1交換機(jī)。
除了交換機(jī)芯片之外,博通還有光電共封的收發(fā)器產(chǎn)品。它也采用了博通的硅光子芯片封裝(SCIP?)技術(shù)。
博通的光電共封收發(fā)器
(圖源:博通)
Marvell
MarvellTeralynx10交換機(jī)是另一款專為800GbE時(shí)代設(shè)計(jì)的51.2T交換機(jī),該交換機(jī)由Marvell的Teralynx1051.2Tbps交換芯片和PAM41.6Tbps光電平臺(tái)Nova組成。Teralynx品牌來自Marvell-Innovium的收購(gòu)。
MarvellTeralynx10芯片跟博通的一樣,也是一款可編程5nm單片交換機(jī)芯片,具有512個(gè)112GSerDes,能滿足32x1.6T、64x800G和128x400G廣泛的交換機(jī)配置。按照Marvell的說法,一個(gè)Teralynx10取代了12個(gè)12.8Tbps一代,而且在同等容量下能減少80%的功耗。
(圖源:Marvell)
Teralynx10使用了Teralynx獨(dú)有的通用超低延遲開關(guān)和緩沖結(jié)構(gòu),還支持擁塞感知路由和實(shí)時(shí)流遙測(cè),使網(wǎng)絡(luò)能夠自動(dòng)調(diào)整和自我修復(fù)。借助線速可編程性,可以添加新的協(xié)議和功能來滿足AI/ML不斷變化的需求。Teralynx10支持廣泛的實(shí)時(shí)網(wǎng)絡(luò)遙測(cè),包括P4帶內(nèi)網(wǎng)絡(luò)遙測(cè)(INT)。這些功能支持預(yù)測(cè)分析、更快的問題解決和更高程度的自動(dòng)化。
這款新的交換機(jī)芯片可以減少AI/ML等分布式應(yīng)用程序在網(wǎng)絡(luò)上花費(fèi)的時(shí)間,最大限度地提高計(jì)算利用率,并滿足人工智能和機(jī)器學(xué)習(xí)不斷增長(zhǎng)的帶寬需求。它適用于下一代數(shù)據(jù)中心網(wǎng)絡(luò)中的枝葉和主干應(yīng)用程序,以及AI/ML和高性能計(jì)算(HPC)結(jié)構(gòu)。Teralynx10將在第二季度提供樣品。
思科
思科也在進(jìn)行光電共封技術(shù)的探索,其正在和芯片制造商Inphi之間基于CPO的交換機(jī)/光學(xué)解決方案的合作,為下一代51.2Tb/s交換機(jī)和800Gb/s可插拔設(shè)備開發(fā)聯(lián)合封裝光學(xué)器件(CPO)。
在本次OFC2023上,思科也演示了CPO技術(shù)實(shí)現(xiàn)的可行性具體步驟。思科指出,其Cisco8111-32EH是一種傳統(tǒng)的32端口2x400G1RU路由器,基于CiscoSiliconOneG100ASIC的2x400G-FR4可插拔光學(xué)模塊(64x400GFR4)。思科CPO路由器配備了完整的協(xié)同封裝的基于硅光子學(xué)的光學(xué)tiles,驅(qū)動(dòng)64x400GFR4,也基于帶CPO襯底的思科SiliconOneG100ASIC。思科還發(fā)明了一種在硅光子IC上執(zhí)行此復(fù)用器/解復(fù)用器的創(chuàng)新方法。思科預(yù)計(jì)試驗(yàn)部署與51.2Tb交換機(jī)周期同時(shí)進(jìn)行,隨后在101.2Tb交換機(jī)周期內(nèi)更大規(guī)模地采用。
英特爾
在光電共封這一技術(shù)上,英特爾是資深的玩家之一。2015年宣布推出其co-packagephotonic技術(shù)。為了提供經(jīng)濟(jì)高效的互連解決方案,英特爾一直在增加其硅光子學(xué)的帶寬,并在不斷探索使用一體封裝的光學(xué)器件。
2019年,Intel收購(gòu)了以太網(wǎng)交換機(jī)芯片和數(shù)據(jù)中心軟件領(lǐng)域的新興領(lǐng)軍企業(yè)BarefootNetworks,2020年3月,英特爾展示了12.8Tb/sBarefootTofino2交換機(jī)與1.6Tb/s集成光子引擎共同封裝的方案,硅光互連平臺(tái)采用1.6Tbps光子引擎,在Intel硅光平臺(tái)上設(shè)計(jì)和制造,可提供4個(gè)400GBase-DR4接口。英特爾表示,使用一體封裝的光學(xué)器件,可將光學(xué)端口置于在同一封裝內(nèi)的交換機(jī)附近,從而可降低功耗,并繼續(xù)保持交換機(jī)帶寬的擴(kuò)展能力。英特爾還表示,其51.2Tb/s解決方案應(yīng)該可以在2023年底進(jìn)行商業(yè)部署。
CPU和GPU廠商的試煉
相信英特爾如此致力于硅光研究不是僅僅為了能與交換機(jī)新芯片共連,未來光學(xué)器件如果能否與CPU、GPU或XPU集成在一起也不得而知。
我們看到,英特爾花費(fèi)了很大的心力,從多種路徑進(jìn)行對(duì)光互聯(lián)技術(shù)的支持。2022年6月30日,英特爾研究院展示了完全集成在硅晶圓上的八波長(zhǎng)分布式反饋(DFB),激光器陣列,該陣列輸出功率均勻性達(dá)到+/-0.25分貝(dB),波長(zhǎng)間隔均勻性到達(dá)±6.5%,這項(xiàng)最新的光電共封裝解決方案使用了密集波分復(fù)用(DWDM)技術(shù),展現(xiàn)了在增加帶寬的同時(shí)顯著縮小光子芯片尺寸的前景。而且更重要的是,它是在英特爾的商用300mm混合硅光子平臺(tái)設(shè)計(jì)和制造的,因此,它為下一代光電共封裝和光互連器件的量產(chǎn)提供了一條清晰的路徑。
在2022年英特爾On峰會(huì)上,英特爾又展示了其正在開發(fā)的一項(xiàng)創(chuàng)新:在可插拔式光電共封裝(pluggableco-packagephotonics)解決方案上的突破。英特爾的研究人員設(shè)計(jì)了一種堅(jiān)固的、高良率的、玻璃材質(zhì)的解決方案,它通過一個(gè)可插拔的連接器簡(jiǎn)化了制造過程,降低了成本,為未來新的系統(tǒng)和芯片封裝架構(gòu)開啟了全新可能。
英偉達(dá)也看中了光互連的潛力,互連的GPU將受益于低延遲數(shù)據(jù)傳輸和顯著減少的信號(hào)損失。Nvidia或?qū)⒃谙乱淮鶱VSwitch上實(shí)施聯(lián)合封裝光學(xué)器件以實(shí)現(xiàn)節(jié)點(diǎn)間通信,這些系統(tǒng)應(yīng)該在互連的NVLink網(wǎng)絡(luò)中支持約4,000個(gè)GPU。
英偉達(dá)正在集各方之力推動(dòng)這一技術(shù)的實(shí)施。據(jù)臺(tái)媒報(bào)道,業(yè)內(nèi)消息人士透露,臺(tái)積電參與了由Nvidia牽頭的研發(fā)項(xiàng)目,該項(xiàng)目將其稱為COUPE(緊湊型通用光子引擎)的硅光子(SiPh)集成技術(shù)用于圖形硬件,以組合多個(gè)AIGPU。
在2023年的OFC會(huì)上,AyarLabs展示了業(yè)界首個(gè)4太比特/秒(Tbps)雙向波分復(fù)用(WDM)光學(xué)解決方案。而NVIDIA的加速計(jì)算平臺(tái)正是由WDM光學(xué)互連等先進(jìn)技術(shù)支持,英偉達(dá)希望通過光互連為AI提供“下一個(gè)百萬倍”加速。Nvidia還參與了AyarLabs去年的C輪融資,當(dāng)時(shí)它籌集1.3億美元用于開發(fā)其帶外激光器和硅光子互連。兩家公司計(jì)劃共同加速光學(xué)I/O技術(shù)的開發(fā)和采用,以支持AI和機(jī)器學(xué)習(xí)(ML)應(yīng)用程序和數(shù)據(jù)量的爆炸式增長(zhǎng)。
光電共封技術(shù)商業(yè)化還有諸多挑戰(zhàn)
但是,光電共封技術(shù)要獲得大規(guī)模的商業(yè)化還需要解決多個(gè)挑戰(zhàn),它必須可靠、可維修、可部署、可顯著節(jié)能并且具有成本效益。雖然光互連有望讓芯片間的帶寬達(dá)到更高水平,特別是在數(shù)據(jù)中心內(nèi)部,但制造上的困難使其成本高昂到難以承受。
挑戰(zhàn)一,CPO技術(shù)嚴(yán)重依賴于硅光子學(xué)技術(shù),需要將光學(xué)元件小型化以適應(yīng)ASIC封裝(體積比傳統(tǒng)QSFP-DD或OSFP模塊小100多倍)。我們看到,專有的CPO方案首先出現(xiàn)在Broadcom、Intel、Marvell和其他一些公司,這些供應(yīng)商大多已經(jīng)收購(gòu)或與創(chuàng)新的硅光子公司合作。他們?cè)谶@一技術(shù)上的積累和努力,使得CPO的商業(yè)化漸漸成為可能。
另一方面,隨著光學(xué)和硅芯片的高度集成,新的工程能力和晶圓代工廠將是非常需要的。
在這方面,格芯是一個(gè)比較具有前瞻的代工廠。自從退出芯片先進(jìn)制程的追逐后,格芯一直在探索其他技術(shù),硅光子正是格芯押注大籌碼的一項(xiàng)技術(shù)。2015年格芯收購(gòu)了IBMMicroelectronics的一部分,因此也從IBMResearch獲得了光子學(xué)專業(yè)知識(shí)和知識(shí)產(chǎn)權(quán)。2016年,格芯就推出了其第一代硅光子平臺(tái),并在同年創(chuàng)建了一個(gè)獨(dú)立的硅光子業(yè)務(wù)。當(dāng)時(shí)帶寬的行業(yè)標(biāo)準(zhǔn)是僅為40GB/s。格芯打賭未來行業(yè)將不得不利用光的力量在全球各地涌現(xiàn)的數(shù)據(jù)中心內(nèi)部和之間移動(dòng)大量數(shù)據(jù)。事實(shí)證明,確實(shí)如此,如今數(shù)據(jù)中心的帶寬已來到400GB/s和800GB/s的數(shù)據(jù)速率。
GFFotonix是格芯為硅光子芯片打造的一個(gè)整體的平臺(tái),這也是業(yè)界唯一的硅光子大批量300mmCMOS制造代工廠。根據(jù)格芯的介紹,該平臺(tái)將光子元件與高性能CMOS邏輯和RF集成在一起,以實(shí)現(xiàn)完全集成的單片電氣和光學(xué)計(jì)算和通信引擎,同時(shí)針對(duì)低信號(hào)損耗降級(jí)進(jìn)行了優(yōu)化。此外,格芯單片硅光子平臺(tái)的光輸入和光輸出可通過高密度光纖陣列、片上集成激光器和銅金屬化實(shí)現(xiàn)與其他半導(dǎo)體芯片的2.5D和3D異構(gòu)集成。
芯片巨頭如Broadcom、思科、Marvell和NVIDIA以及AyarLabs、Lightmatter、PsiQuantum、Ranovus和Xanadu在內(nèi)的光子計(jì)算領(lǐng)域的廠商都與格芯有著密切的交流合作。此外,EDA軟件廠商Ansys、Cadence和Synopsys等也正在提供支持基于集成硅光子學(xué)的芯片和小芯片的設(shè)計(jì)工具。
寫在最后
總而言之,光電共封的解決方案確實(shí)使得新一代的交換機(jī)與前幾代相比發(fā)生了很大的突破,但是如文中所述,CPO要成為主流還有諸多因素要克服,據(jù)Yole分析師的說法,盡管CPO具有技術(shù)優(yōu)勢(shì),但它將很難與可插拔模塊競(jìng)爭(zhēng),在很長(zhǎng)一段時(shí)間內(nèi),可插拔模塊仍將是首選??刹灏?、OBO和CPO將共存一段時(shí)間。
現(xiàn)在,光學(xué)器件可以與以太網(wǎng)交換機(jī)芯片共同封裝,未來,它能否與CPU、GPU或XPU集成在一起也或許是一個(gè)探究方向。在摩爾定律動(dòng)力不足的情況下,光電共封這項(xiàng)技術(shù)正在嶄露其潛力,從另一條新道路上來滿足當(dāng)下數(shù)據(jù)量蓬勃發(fā)展的處理需求。而且很重要的一個(gè)趨勢(shì)是,主要的芯片巨頭們都在排兵布陣,光電共封技術(shù)正在向我們走進(jìn)。