[歐月華 任艷 陳璁]
PUE對(duì)數(shù)據(jù)中心和算力網(wǎng)絡(luò)的運(yùn)營(yíng)影響巨大,高PUE可能導(dǎo)致高能源成本、環(huán)境污染、競(jìng)爭(zhēng)不利等問題,因此數(shù)據(jù)中心和算力網(wǎng)絡(luò)的運(yùn)營(yíng)者通常會(huì)積極尋求方法來降低PUE,以提高其能源效率并降低運(yùn)營(yíng)成本[1]。此外,國(guó)家相關(guān)部委發(fā)布的東數(shù)西算、智能算力網(wǎng)絡(luò)、數(shù)字中國(guó)等國(guó)家戰(zhàn)略政策都對(duì)綠色節(jié)能提出了重要目標(biāo)任務(wù)[2]。
目前,傳統(tǒng)的散熱方式如風(fēng)冷和空調(diào)制冷,已經(jīng)無法滿足當(dāng)前高密數(shù)據(jù)中心和算力網(wǎng)絡(luò)在降低PUE和業(yè)務(wù)擴(kuò)展方面的需求[3]。此外,很多高功率設(shè)備具有高能耗和高密度特征,使用風(fēng)冷散熱不僅能耗大,還會(huì)產(chǎn)生高噪音。因此,液冷技術(shù)成為一種備受關(guān)注的新興制冷技術(shù),有效解決了高密度設(shè)備散熱的難題,目前已在數(shù)據(jù)中心中得到廣泛應(yīng)用[4]。通信運(yùn)營(yíng)商也在邊緣計(jì)算和BBU集中部署等場(chǎng)景積極研究和試點(diǎn)液冷散熱技術(shù),并取得了顯著的節(jié)能效果。
光模塊是數(shù)據(jù)中心和通信機(jī)房網(wǎng)絡(luò)通信設(shè)備的核心配件之一,隨著各種設(shè)備為了滿足流量增長(zhǎng)的需求不斷迭代升級(jí),需要使用傳輸速率更高的光模塊,比如較早的40 Gbit/s、100 Gbit/s和現(xiàn)在的400 Gbit/s,800 Gbit/s,甚至是將來的1.6 Tbit/s光模塊[5],光模塊的使用數(shù)量和功耗也隨之增加,光模塊自身也需要液冷技術(shù)進(jìn)行功耗控制和散熱。
為了滿足當(dāng)前高密數(shù)據(jù)中心和算力網(wǎng)絡(luò)對(duì)降低PUE的需求,需要考慮通過替代或者升級(jí)目前風(fēng)冷應(yīng)用的光模塊,以適應(yīng)液冷系統(tǒng)的應(yīng)用場(chǎng)景。根據(jù)冷卻液與信息通信設(shè)備發(fā)熱器件之間的換熱方式,液冷系統(tǒng)通常分為冷板式、浸沒式和噴淋式液冷系統(tǒng)[6]。由于冷板式液冷系統(tǒng)中的冷卻液不與發(fā)熱電子部分直接接觸,所以目前液冷應(yīng)用的光模塊在冷板式液冷系統(tǒng)中應(yīng)用時(shí),一般無需考慮兼容性方面問題。浸沒式和噴淋式液冷系統(tǒng)都是使用冷卻液和散熱器件直接接觸,從而進(jìn)行熱交換。噴淋式液冷系統(tǒng)只需在噴淋模塊調(diào)整噴淋頭,實(shí)現(xiàn)噴淋設(shè)備與散熱器件的對(duì)應(yīng)即可[7];浸沒式液冷系統(tǒng)直接將散熱器件浸泡在冷卻液里,冷卻液吸收散熱器件產(chǎn)生的熱量后,將熱量傳遞給熱交換中的水,然后通過水循環(huán)將熱量傳遞到室外的散熱裝置中[8]。由于光模塊以往的設(shè)計(jì)都是基于風(fēng)冷的應(yīng)用場(chǎng)景,因此對(duì)于浸沒式和噴淋式液冷系統(tǒng)的應(yīng)用場(chǎng)景,光模塊需要對(duì)滿足該場(chǎng)景的環(huán)境進(jìn)行相應(yīng)的設(shè)計(jì),并且在應(yīng)用中規(guī)范技術(shù)要求,以實(shí)現(xiàn)在液冷場(chǎng)景下的正常工作和數(shù)據(jù)傳輸。
中國(guó)電信和華為組成聯(lián)合創(chuàng)新實(shí)驗(yàn)局,在OTN設(shè)備中應(yīng)用了冷板式液冷解決方案,其中OTN設(shè)備采用兩套相同的CFP封裝光模塊的樣品,分別在高效散熱、復(fù)雜業(yè)務(wù)場(chǎng)景下的溫度穩(wěn)定性和風(fēng)冷方案對(duì)比試驗(yàn)結(jié)果如下。
①液冷方案中,在40 ℃進(jìn)液前提下,光模塊全部依靠液冷散熱,殼溫保持在70 ℃以下,溫度穩(wěn)定無超溫,滿足OTN散熱要求。
②液冷方案相對(duì)于風(fēng)冷方案在光模塊散熱上大部分收益5℃以上,功率保持不變。
具體試驗(yàn)數(shù)據(jù)如表1所示。
表1 風(fēng)冷光模塊散熱與冷板式液冷光模塊散熱對(duì)比數(shù)據(jù)
液冷光模塊通過在液冷降溫環(huán)境下工作,從而降低光模塊的工作溫度和熱應(yīng)力,預(yù)估可以提高其穩(wěn)定性和可靠性,并且提高其使用壽命。
液冷方案比較傳統(tǒng)風(fēng)冷方案,對(duì)整機(jī)環(huán)境散熱更優(yōu),光模塊運(yùn)行管殼溫度更低,規(guī)模應(yīng)用下功耗較風(fēng)冷環(huán)境預(yù)計(jì)會(huì)有一定比例的降低。
其他液冷方案比如噴淋式、浸泡式液冷和冷板式液冷雖然實(shí)現(xiàn)原理不一樣,但是噴淋式、浸泡式液冷系統(tǒng)由于冷卻劑直接與發(fā)熱器件接觸,將熱量直接帶走,預(yù)估控溫效果更佳。
3.2.1 可能的失效模式
液冷光模塊的失效模式涉及多個(gè)方面,這些方面可能會(huì)影響其性能、可靠性和持續(xù)正常運(yùn)行。以下是一些可能的液冷光模塊失效模式。
①泄漏或滲漏:光模塊光電器件與光接口、光接口與尾纖之中存在著光路,由于光模塊與液體介質(zhì)接觸,可能會(huì)出現(xiàn)泄漏或滲漏的情況,導(dǎo)致冷卻液進(jìn)入光路中,對(duì)光信號(hào)的傳輸造成一定的影響。因此,液冷光模塊重要的挑戰(zhàn)之一便是光模塊的關(guān)鍵封裝器件的密封性程度,如驅(qū)動(dòng)器、TIA、激光器光電探測(cè)器、還有多通道模塊用的波分復(fù)用器、V型槽陣列、SOA放大器,相干模塊中的光波導(dǎo)元件以及光接口部分的密封性程度等。
②腐蝕:如果使用的冷卻液與模塊內(nèi)部的材料不兼容,可能會(huì)引起腐蝕,導(dǎo)致元件失效或損壞。
③雜質(zhì):溶解后的顆粒(尤其是金屬顆粒),隨著液體的循環(huán)流動(dòng),附著在光模塊的電路部件,導(dǎo)致元件或電路失效、劣化。
3.2.2 光模塊在液冷機(jī)柜接線
液冷機(jī)柜是液冷生態(tài)系統(tǒng)的基本構(gòu)建模塊,噴淋式和浸沒式液冷機(jī)柜將整個(gè)服務(wù)器噴淋或者浸入液體中進(jìn)行散熱,因此需要一定的密封性。光模塊作為通信設(shè)備數(shù)據(jù)傳輸器件,需要考慮光模塊與液冷機(jī)柜之間的走線、出入纖兼容性,以及日常的維護(hù)管理。
4.1.1 封裝外觀
目前,有源光纜光模塊(簡(jiǎn)稱AOC光模塊)因其具有功耗低、體積小、重量輕和抗電磁干擾等優(yōu)勢(shì)[9],可為數(shù)據(jù)中心內(nèi)部服務(wù)器到交換機(jī)間的短距離連接提供高密度、低成本和小功耗的解決方案。
基于AOC光模塊的封裝為基礎(chǔ),目前有兩種光模塊封裝外觀滿足液冷環(huán)境應(yīng)用的要求,本文中稱為線纜雙端液冷光模塊和線纜單端尾纖型液冷光模塊,其中線纜雙端液冷光模塊參考傳統(tǒng)AOC光模塊的封裝外觀,即光纜兩端都連接有光模塊的封裝外觀;線纜單端尾纖型液冷光模塊為光纜一端連接光模塊,另一端為光纖活動(dòng)連接器的封裝外觀。
線纜雙端液冷光模塊和線纜單端尾纖型液冷光模塊由于在液冷環(huán)境中應(yīng)用(線纜單端尾纖型液冷光模塊的光纖活動(dòng)連接器一端不浸泡在液體中),需要保證設(shè)計(jì)光路(模塊自身、光纜和模塊之間)足夠密閉,以滿足浸沒在冷卻液中工作的情況。
4.1.2 液冷光模塊線纜
線纜雙端液冷光模塊和線纜單端尾纖型液冷光模塊都包括有線纜,類型包括B6類單模光纖和多模光纖,多模光纖類型包括OM2、OM3、OM4、OM5等。AOC線纜標(biāo)準(zhǔn)目前有行標(biāo)YD/T 3537-2019《通信有源光纜(AOC)用線纜》,根據(jù)AOC光模塊在通信機(jī)房和數(shù)據(jù)中心的使用,多模光纜長(zhǎng)度可以任意長(zhǎng)度交貨,一般在150 m以內(nèi)。線纜的護(hù)套材料包括低煙無鹵(LSZH)、聚氯乙烯(PVC)、熱塑性聚氨酯橡膠(TPU)、中密度聚乙烯(MDPE)等。
4.1.3 光接口類型(線纜單端尾纖型液冷光模塊)
線纜單端尾纖型液冷光模塊的光纜的一端是光接口,其光接口的類型按照實(shí)際使用場(chǎng)景分別包括有FC、SC、LC和MPO等。
比如液冷光模塊100G SR4 接口類型有多模 MPO-12、液冷光模塊100G PSM4 接口有單模 MPO-12,如圖1所示。線纜單端尾纖型液冷光模塊光接口的MPO 是公頭,線序和接收端類型的 MPO的線序不同。
圖1 MPO接口示意圖
液冷光模塊的極限工作條件指標(biāo)包括貯存溫度、相對(duì)濕度、供電電壓等要求,建議與封裝、速率一樣的AOC光模塊保持一致。
液冷光模塊工作條件的指標(biāo)包括:供電電壓、管殼溫度、并且由于在密封的機(jī)柜中工作,同時(shí)可考慮液冷光模塊的光纖彎曲半徑、液體浸泡深度等,如表2所示。
表2 推薦工作條件
對(duì)于光模塊的插、拔力和插拔次數(shù)要求,目前CCSA行標(biāo)給出了100 Gbit/s、200 Gbit/s、800 Gbit/s 等速率的AOC光模塊相應(yīng)要求,但是CCSA行標(biāo)AOC光模塊是針對(duì)風(fēng)冷的應(yīng)用場(chǎng)景,而液冷光模塊來說,由于浸沒在液體中受到液體某方向的壓力,可能需要更多的力來插入或拔出,液冷光模塊的設(shè)計(jì)和生產(chǎn)方面,可能需重新評(píng)估冷卻液浸沒下模塊的插、拔力和插拔次數(shù)。
4.3.1 密封技術(shù)概述
對(duì)于液冷光模塊可以采用的密封技術(shù)包括有氣密性封裝和液密性封裝或者兩者的相結(jié)合,以保持光模塊的密封性,防止氣體或液體從內(nèi)部泄漏到外部或從外部進(jìn)入內(nèi)部的過程。氣密封裝專門用于阻止氣體的滲透,而液密封裝則專門用于阻止液體的滲透,兩種技術(shù)主要區(qū)別如下。
①封裝所使用的材料和技術(shù)可能會(huì)有所不同,氣密封裝可能使用氣密性高的材料,而液密封裝可能使用防水或耐腐蝕的材料。
②封裝設(shè)計(jì)差異,液密封裝可能需要更強(qiáng)的結(jié)構(gòu)以抵抗液體壓力,而氣密封裝可能更注重氣密性,處理較大的氣體壓力差。
③封裝外觀上,氣密性封裝通常在封裝的蓋板和底座之間采用平行封焊或者儲(chǔ)能焊的方式進(jìn)行焊接;而液冷光模塊需要整體實(shí)現(xiàn)密閉封裝(液封),以此實(shí)現(xiàn)同外部冷卻液的完全隔離。
4.3.2 模塊內(nèi)部密封方式和工藝
目前風(fēng)冷應(yīng)用的光模塊內(nèi)部密封包括有氣密性封裝和非氣密性封裝。光模塊氣密封裝的目的是為了防止外部的水汽和其他有害氣體進(jìn)入封裝內(nèi)部。氣密封裝和非氣密封裝器件在外觀上有很明顯的區(qū)別。目前來說,只有陶瓷、玻璃、金屬這三類材料能夠做氣密封裝,其他的材料比如塑料只能做非氣密封裝。其次,即使用了上述3種材料,還需要看封裝的蓋板和底座之間的結(jié)合方式,只有采用了平行封焊或者儲(chǔ)能焊這兩種結(jié)合方式,才算氣密封裝。如果使用的是其他結(jié)合方式比如點(diǎn)膠,還是屬于非氣密封裝。
電信級(jí)光模塊多采用氣密性的TO-CAN[10]或BOX[11]封裝技術(shù),而數(shù)據(jù)中心光模塊多采用非氣密性COB[12]封裝技術(shù),但是當(dāng)數(shù)據(jù)中心中采用浸沒或者噴淋式液冷系統(tǒng)時(shí),非氣密性封裝COB工藝的光模塊在液體環(huán)境中無法直接使用,因此在液冷數(shù)據(jù)中心中宜使用BOX和TOCAN兩種氣密性封裝光模塊,又或者對(duì)于光電部分COB封裝的光模塊進(jìn)行整體的全塑封設(shè)計(jì)(液封),以有效阻止液冷環(huán)境中的冷卻液對(duì)光模塊光路部分的污染及對(duì)光學(xué)通路的干擾。
對(duì)于目前光模塊的發(fā)送器件和接收器件封裝方式和工藝介紹如下。
①TO-CAN同軸封裝(氣密性封裝)
殼體通常為圓柱形,一般用于40 Gbit/s內(nèi)的傳輸系統(tǒng)。因?yàn)槠潴w積小的特點(diǎn),實(shí)現(xiàn)內(nèi)置制冷比較困難,散熱是亟待解決的問題,難以用于大電流下的高功率輸出,因此難以用于長(zhǎng)距離傳輸,最主要的用途還在于2.5 Gbit/s及10 Gbit/s短距離傳輸。TO-CAN的氣密封裝使用儲(chǔ)能焊,通過脈沖電流融化縫隙實(shí)現(xiàn)氣密性焊封。
②蝶形封裝(氣密性封裝)
蝶形封裝主要是為了解決散熱問題,可以提供更大的熱沉,同時(shí)也可以加配帶溫度控制的TEC溫控模塊,內(nèi)部還有陶瓷基塊、芯片、熱敏電阻、背光監(jiān)控等。因此一個(gè)蝶形封裝器件相當(dāng)于一個(gè)OSA,是比 TO-CAN更高一級(jí)的器件。
③BOX(盒式)封裝(氣密性封裝)
BOX封裝用于多通道并行封裝,可做成氣密性和非氣密性封裝,常用于中長(zhǎng)距離高速光學(xué)設(shè)備傳輸,價(jià)格較昂貴。BOX封裝采用平行封焊設(shè)備實(shí)現(xiàn)氣密封裝。
④COB(Chip On Board)封裝(非氣密性封裝)
光模塊的COB封裝簡(jiǎn)單來說是將激光芯片粘附在PCB基板上,包括TIA/LA芯片、激光陣列和接收器陣列等集成封裝在一個(gè)小空間內(nèi),以實(shí)現(xiàn)小型化,此為非氣密性封裝。
4.3.3 整體密封方案
液冷光模塊需要同時(shí)防止冷卻液進(jìn)入光模塊的光路,即光器件與光接口、光接口與尾纖之中存在的光路中,因此液冷光模塊需要整體實(shí)現(xiàn)密閉封裝(液封),以此實(shí)現(xiàn)同外部冷卻液的完全隔離,如圖2所示。
圖2 整體密封方案示例圖
目前有些液冷光模塊產(chǎn)品使用膠水進(jìn)行密封以實(shí)現(xiàn)光模塊整體的密閉封裝,結(jié)合業(yè)內(nèi)液冷系統(tǒng)常用的冷卻液特性,液冷光模塊的封裝膠水與氟化液體和油類的這類常用的冷卻液需要良好兼容性能。
目前液冷光模塊通常采用的有UV膠以及低壓注塑材料作為密封膠[13],例如:①利用環(huán)氧體系膠水作為液冷光模塊的封膠;②采用泰格士9109、漢高5375、漢高6208S或OM657等材料制作塑封層,分別以很低的注射壓力(1.5~40 bar)將封裝材料注入模具并快速固化成型(5~50 s)封裝。
在光模塊基礎(chǔ)性能要求方面,線纜雙端液冷光模塊性能指標(biāo)須考慮其發(fā)送端和接收端電氣特性,線纜單端尾纖型液冷光模塊除了考慮發(fā)送端的電氣特性,還須考慮出尾纖接頭后的光學(xué)性能。
在光模塊可靠性測(cè)試中,機(jī)械完整性和溫度耐久性測(cè)試一般依據(jù)Telcordia GR-468-CORE,但是Telcordia GR-468-CORE主要面向的是一般風(fēng)冷環(huán)境包括工業(yè)級(jí)應(yīng)用的光模塊,沒有完全考慮到液冷光模塊的應(yīng)用要求對(duì)應(yīng)的測(cè)試方法。因此對(duì)于在液體噴淋或者浸沒下環(huán)境工作的光模塊,可能需要考慮相應(yīng)適用的測(cè)試方法,以確保其性能和可靠性。
建議液冷光模塊在風(fēng)冷AOC光模塊的可靠性試驗(yàn)基礎(chǔ)上,除了需要在通過風(fēng)冷AOC光模塊對(duì)應(yīng)的機(jī)械試驗(yàn)和非工作環(huán)境試驗(yàn)(主要非工作環(huán)境存儲(chǔ)試驗(yàn))外,可以考慮單獨(dú)的液冷工作環(huán)境的試驗(yàn),包括液冷壽命(高溫)、液冷溫度循環(huán)和液冷浸沒的測(cè)試方法(可考慮通過加壓模擬在液體浸泡到達(dá)一定深度),以檢測(cè)液冷光模塊的早期失效和推測(cè)長(zhǎng)期壽命。
光模塊在噴淋液冷或者浸沒式液冷環(huán)境中,光模塊的外殼、尾纖及接口的材料,由于與冷卻液接觸,存在與冷卻液發(fā)生反應(yīng)的可能,包括兩個(gè)方面:一是光模塊的材料吸收冷卻液,二是光模塊材料的一些成分的析出。因此,光模塊中使用的所有材料應(yīng)考慮和冷卻液的兼容性,以確保光模塊的正常運(yùn)行和壽命。此外冷卻液的清潔和更換也是確保光模塊性能和壽命的重要因素,光模塊在使用過程中,建議定期更換冷卻液,并在更換前清洗和沖洗光模塊中的液體通道,以防止雜質(zhì)和沉積物的積累。
總的來說,在材料兼容性方面,需要考察冷卻液是否與光模塊的材料發(fā)生反應(yīng)或產(chǎn)生溶解萃取等影響,如果光模塊的使用材料在冷卻液廠商兼容性清單之外的物料,應(yīng)進(jìn)行兼容性測(cè)試,包括浸泡實(shí)驗(yàn)和萃取實(shí)驗(yàn),通過測(cè)試對(duì)冷卻液進(jìn)行粘度、介電常數(shù)和擊穿電壓等物性常數(shù)分析,同時(shí)對(duì)殘留物、顆粒度等液體成分進(jìn)行測(cè)試。
浸泡實(shí)驗(yàn)測(cè)試方法可參考:
①ASTM-D3455-2011《變壓器油與材料相容性標(biāo)準(zhǔn)進(jìn)行測(cè)試》;
②GB/T 14832-2008《標(biāo)準(zhǔn)彈性體材料與液壓液體的相容性》。
萃取實(shí)驗(yàn)測(cè)試方法可參考索式萃取測(cè)試相關(guān)標(biāo)準(zhǔn):
①GB5512-85《糧食、油料檢驗(yàn)粗脂肪測(cè)定法》;
②GB5009.6-2016《食品安全國(guó)家標(biāo)準(zhǔn)食品中脂肪的測(cè)定》。
另外,光纜的護(hù)套材料兼容性:護(hù)套材料與液冷系統(tǒng)冷卻液(比如油類),目前的測(cè)試標(biāo)準(zhǔn)有GB/T 2951.21-2008《電纜和光纜絕緣和護(hù)套材料通用試驗(yàn)方法第21部分:彈性體混合料專用試驗(yàn)方法——耐臭氧試驗(yàn)——熱延伸試驗(yàn)——浸礦物油試驗(yàn)》的浸礦物油試驗(yàn)。
液冷光模塊相比常規(guī)光模塊在成本方面的增加主要包括兩個(gè)方面:一個(gè)是物料成本,來自于密封材料,需要絕緣、導(dǎo)熱性能好、穩(wěn)定性強(qiáng)的密封材料;另外一個(gè)是來自加工成本,需要通過較高的工藝水平和制造水平實(shí)現(xiàn)密封但是不能影響原來的性能參數(shù)、電磁兼容特性等要求。
液冷光模塊在國(guó)內(nèi)外的應(yīng)用主要集中在數(shù)據(jù)中心、通信設(shè)備和高性能計(jì)算領(lǐng)域。這些應(yīng)用領(lǐng)域需要高性能的光傳輸解決方案,并且越來越重視能效和散熱管理,因此液冷技術(shù)在這些領(lǐng)域中具有廣泛的市場(chǎng)前景。
為了滿足高性能計(jì)算和通信應(yīng)用中提高性能、能效、可靠性和適應(yīng)未來技術(shù)等多方面的需求,液冷光模塊技術(shù)還需要進(jìn)一步促進(jìn)了技術(shù)的標(biāo)準(zhǔn)化,包括液冷光模塊的技術(shù)要求、密封技術(shù)要求、可靠性測(cè)試方法和運(yùn)維管理技術(shù)方面的標(biāo)準(zhǔn)化工作,以指導(dǎo)液冷光模塊的開發(fā)、設(shè)計(jì)、生產(chǎn)和保證液冷光模塊量產(chǎn)階段可靠性,促進(jìn)技術(shù)和產(chǎn)業(yè)鏈的發(fā)展成熟,更好的支撐高密數(shù)據(jù)中心和算力網(wǎng)絡(luò)采用液冷系統(tǒng)降低PUE和業(yè)務(wù)擴(kuò)展方面的需求和綠色低碳發(fā)展。