韓 雪
(天津廣播電視臺(tái) 天津300074)
天津廣播電視臺(tái)高度重視互聯(lián)網(wǎng)技術(shù)在廣播電視領(lǐng)域的創(chuàng)新應(yīng)用,大力支持廣電利用先進(jìn)技術(shù)驅(qū)動(dòng)新聞創(chuàng)新,以科技創(chuàng)新推動(dòng)智慧廣電建設(shè)。本文探討了天津廣播電視臺(tái)“新聞云”存儲(chǔ)系統(tǒng)搭建的技術(shù)需求與方案,并對(duì)后續(xù)的2次擴(kuò)容及改造后的新聞制播系統(tǒng)進(jìn)行簡(jiǎn)要介紹,以期為其他“新聞云”系統(tǒng)建設(shè)提供經(jīng)驗(yàn)。
2017年前天津電視臺(tái)有2個(gè)部門(mén)進(jìn)行新聞節(jié)目制作:早期成立的新聞部,制播機(jī)房在數(shù)字大廈3~4層,節(jié)目在衛(wèi)視頻道播出;2013年成立的新聞?lì)l道,制播機(jī)房在數(shù)字大廈 7~8層,節(jié)目在新聞?lì)l道播出。
隨著融媒體的發(fā)展,2個(gè)部門(mén)之間的聯(lián)系與協(xié)作越來(lái)越多,但由于分別使用兩套制播系統(tǒng),無(wú)法在文稿和節(jié)目資源管理器中方便地共享素材資源。資源互通時(shí)經(jīng)常需要工作人員跑上跑下,溝通不便,效率低下。2017年2個(gè)部門(mén)進(jìn)行了合并,制播系統(tǒng)的整合也勢(shì)在必行。原新聞部制播系統(tǒng)已投入使用 6年有余,設(shè)備老舊,故障頻出,在網(wǎng)絡(luò)部精心維護(hù)下得以繼續(xù)使用,但已嚴(yán)重威脅播出安全;原新聞?lì)l道制播系統(tǒng)投入使用 4年以上,技術(shù)不夠先進(jìn),無(wú)法滿足新聞?lì)l道日益發(fā)展的節(jié)目制作需求。在這一背景下,2017年,“新聞云”系統(tǒng)應(yīng)運(yùn)而生。在設(shè)計(jì)方案和用戶需求中,要求新系統(tǒng)素材存儲(chǔ)量大,可供同時(shí)訪問(wèn)的人數(shù)多,這對(duì)存儲(chǔ)系統(tǒng)的容量、安全性、響應(yīng)速度等方面的要求更為嚴(yán)格,因此在技術(shù)選擇上需要更加嚴(yán)謹(jǐn)與有所創(chuàng)新。
結(jié)合新聞?lì)l道節(jié)目制播需求,擬建設(shè) 720TB裸容量數(shù)據(jù)存儲(chǔ)系統(tǒng),主要存儲(chǔ)原始采集素材,回采成片,共享資料,以及收集管理節(jié)目編輯的工程文件等內(nèi)容。
為滿足多用戶在線使用以及系統(tǒng)應(yīng)用整體的吞吐帶寬需要,保證數(shù)據(jù)、信息等訪問(wèn)的流暢性,存儲(chǔ)系統(tǒng)需要實(shí)現(xiàn)高吞吐的帶寬設(shè)計(jì),從而提供多用戶或應(yīng)用并發(fā)訪問(wèn)。該系統(tǒng)能夠有效利用網(wǎng)絡(luò)帶寬,各項(xiàng)性能可通過(guò)規(guī)模增加實(shí)現(xiàn)平滑增長(zhǎng)。
系統(tǒng)的建設(shè)同樣需要考慮未來(lái)適用的要求,新聞?lì)l道的素材積累量大,業(yè)務(wù)應(yīng)用也會(huì)相應(yīng)變化和發(fā)展,因此,需要系統(tǒng)能夠快速實(shí)施資源的升級(jí),從而在業(yè)務(wù)與服務(wù)不間斷的狀態(tài)下平滑擴(kuò)展,不會(huì)導(dǎo)致架構(gòu)發(fā)生根本性變化,為不斷產(chǎn)生和變化的業(yè)務(wù)需求提供持續(xù)的支持,滿足業(yè)務(wù)系統(tǒng)的快速整合和部署對(duì)核心系統(tǒng)基礎(chǔ)架構(gòu)的特別需求。
要求系統(tǒng)能夠以低硬件成本、低維護(hù)成本實(shí)現(xiàn)高可靠高性能應(yīng)用要求,充分提高資源利用率,簡(jiǎn)化管理,并能靈活、可持續(xù)擴(kuò)展。
要求系統(tǒng)具有自適應(yīng)管理能力,安裝、維護(hù)、升級(jí)簡(jiǎn)易方便,提供統(tǒng)一易用的 WEB配置管理監(jiān)控系統(tǒng),實(shí)現(xiàn)智能化管理。
由于新聞制播系統(tǒng)的特殊性與綜合性,系統(tǒng)應(yīng)能夠提供通用的文件系統(tǒng)接口,方便用戶及應(yīng)用系統(tǒng)的訪問(wèn),這樣可以減少應(yīng)用集成端口以及相應(yīng)端口開(kāi)發(fā)的工作量,實(shí)現(xiàn)系統(tǒng)快速部署與集成。
Isilon集群存儲(chǔ)具有開(kāi)放式架構(gòu)、分布式操作系統(tǒng),負(fù)載均衡、易于安裝和管理,性能好、可靠性高,能在線擴(kuò)展容量和帶寬等優(yōu)點(diǎn),成為適應(yīng)“新聞云”需求的存儲(chǔ)系統(tǒng)。
開(kāi)放式架構(gòu)是硬件層面的一個(gè)概念,是指將集群系統(tǒng)中多臺(tái)本身性能較差的個(gè)體服務(wù)器聚合起來(lái),使集群的最終處理能力比高端服務(wù)器更好。這種類(lèi)似于“搭積木”模式搭建起來(lái)的系統(tǒng)采用的就是開(kāi)放式架構(gòu)。與之相對(duì)的是 scale-up 架構(gòu),是指設(shè)備處理能力上限在購(gòu)買(mǎi)時(shí)就已確定,如果需求超過(guò)上限,只能重新購(gòu)買(mǎi)更高性能的設(shè)備。
開(kāi)放式架構(gòu)意味著靈活多變,能夠通過(guò)增加節(jié)點(diǎn),不斷提升系統(tǒng)整體性能,在充分利用原有資源節(jié)約改造成本的同時(shí)滿足頻道日益增長(zhǎng)的需求。
OneFS既是操作系統(tǒng)又是集群存儲(chǔ)的文件系統(tǒng),Isilon存儲(chǔ)通過(guò)OneFS的同步功能,使各節(jié)點(diǎn)達(dá)到真正的全局一致性,每個(gè)節(jié)點(diǎn)都能處理讀寫(xiě)請(qǐng)求,有效解決了訪問(wèn)文件系統(tǒng)時(shí)發(fā)生的單點(diǎn)故障。
比較之前新聞部和新聞?lì)l道存儲(chǔ)都使用卷管理和 raid技術(shù)管理保存數(shù)據(jù)的方法,OneFS將數(shù)據(jù)分布到系統(tǒng)的每一個(gè)節(jié)點(diǎn),提高了磁盤(pán)空間利用率,改善了老系統(tǒng)中存在的節(jié)點(diǎn)等級(jí)差異和內(nèi)在瓶頸。
OneFS使用 Infiniband交換機(jī)進(jìn)行集群內(nèi)通信和同步,將所有數(shù)據(jù)(包括元數(shù)據(jù))完全并行分布到所有節(jié)點(diǎn)中,創(chuàng)建一個(gè)共享存儲(chǔ)池,將數(shù)據(jù)整合到真正的單一文件系統(tǒng) OneFS 中,系統(tǒng)的單一性決定了它不會(huì)出現(xiàn)跨lun引發(fā)的性能問(wèn)題。
比如之前新聞?lì)l道EMC存儲(chǔ)出現(xiàn)的多個(gè)lun在不同控制器之間transpass,造成前端讀寫(xiě)出現(xiàn)丟幀現(xiàn)象。
存儲(chǔ)還內(nèi)嵌許多程序模塊,SmartConnect 模塊非常符合制播業(yè)務(wù)需求,主要用作均衡負(fù)載。以 8個(gè)節(jié)點(diǎn)為例,寫(xiě)入數(shù)據(jù)時(shí)從8個(gè)結(jié)點(diǎn)中選擇出目前最閑的結(jié)點(diǎn)來(lái)接收此次讀寫(xiě)請(qǐng)求的文件,這個(gè)文件到了結(jié)點(diǎn)之后,并沒(méi)有立刻寫(xiě)到磁盤(pán)上。此時(shí)OneFS會(huì)把這個(gè)文件自動(dòng)分成8個(gè)小塊,通過(guò)后端IB交換機(jī)的內(nèi)存級(jí)別拷貝功能把 8塊數(shù)據(jù)分別寫(xiě)到其他節(jié)點(diǎn)各自的硬盤(pán)上。充分利用了 Infiniband的帶寬高、網(wǎng)絡(luò)延遲小的優(yōu)勢(shì),提供非常高的讀寫(xiě)性能,避免在節(jié)目制作高峰期前端讀寫(xiě)延時(shí)、卡頓的現(xiàn)象發(fā)生。
Isilon可以提供結(jié)點(diǎn)級(jí)的容錯(cuò),以 5個(gè)節(jié)點(diǎn)為例,使用 3+2數(shù)據(jù)保護(hù)模式,向存儲(chǔ)系統(tǒng)寫(xiě)入一個(gè)文件時(shí),該文件數(shù)據(jù)會(huì)被分成 5份分別存儲(chǔ)到 5個(gè)節(jié)點(diǎn),即使 2個(gè)節(jié)點(diǎn)的所有硬盤(pán)全部宕掉,整個(gè)文件數(shù)據(jù)仍然能夠完整恢復(fù)。這種基于文件系統(tǒng)的節(jié)點(diǎn)級(jí)的容錯(cuò),與之前的 raid技術(shù)有著本質(zhì)的區(qū)別。這種N+M數(shù)據(jù)保護(hù)模式最高提供4個(gè)節(jié)點(diǎn)的容錯(cuò)能力。
這與其他產(chǎn)品容錯(cuò)機(jī)制完全不一樣,數(shù)據(jù)保護(hù)級(jí)別可以在線更換,數(shù)據(jù)仍然是完整的。該特性極大程度地保證了節(jié)目素材的安全性。
新聞云存儲(chǔ)系統(tǒng)搭建時(shí),軟、硬件配置如下:
硬件,5個(gè)存儲(chǔ)節(jié)點(diǎn)(X410-144TB/64GB/2X10 GESFP+2X1GE),2臺(tái) Infiniband交換機(jī)(Switch IB QDR 36 Port 1PS 1U Intel)。
軟件包括 SmartConnect Advanced、InsightIQ、SmartQuota,分別提供動(dòng)態(tài)客戶端負(fù)載平衡功能、集群監(jiān)控功能、配額限制功能。
每個(gè)X410節(jié)點(diǎn)配置36塊4TB SATA硬盤(pán),總體裸空間為 720T,使用 3+2數(shù)據(jù)保護(hù)模式,實(shí)際可用空間520TB,配置2個(gè)千兆和2個(gè)萬(wàn)兆網(wǎng)絡(luò)接口。通過(guò)Infiniband高速網(wǎng)口,鏈接36口的Infiniband交換機(jī),用于節(jié)點(diǎn)間內(nèi)部數(shù)據(jù)互聯(lián)互通,通過(guò)萬(wàn)兆網(wǎng)口連接核心交換機(jī),為生產(chǎn)網(wǎng)提供業(yè)務(wù)數(shù)據(jù)讀寫(xiě)訪問(wèn)。
隨著頻道升級(jí)改版,節(jié)目播出時(shí)長(zhǎng)大為增加,目前,新聞?lì)l道全天有 11檔直播節(jié)目,每日直播時(shí)長(zhǎng)增加到 12h,還有部分周播錄播節(jié)目在網(wǎng)內(nèi)制作。而且隨著采播技術(shù)高清化的全面落地,節(jié)目素材越來(lái)越清晰,制播系統(tǒng)所需存儲(chǔ)空間量也越來(lái)越大,同時(shí)在線讀寫(xiě)訪問(wèn)用戶數(shù)量也在增加。
為了滿足頻道的使用需求,網(wǎng)絡(luò)部結(jié)合使用利舊設(shè)備和新采購(gòu)設(shè)備,先后對(duì)存儲(chǔ)系統(tǒng)進(jìn)行兩次擴(kuò)容升級(jí)改造。第一次擴(kuò)容,于 2017年 6月增加 2個(gè)同型號(hào)同配置的 Isilon存儲(chǔ)節(jié)點(diǎn),為全運(yùn)會(huì)利舊設(shè)備;第二次擴(kuò)容,于2017年12月增加4個(gè)同型號(hào)同配置的Isilon存儲(chǔ)節(jié)點(diǎn),為索貝新購(gòu)設(shè)備。
擴(kuò)容工作內(nèi)容主要包括集群內(nèi)外部網(wǎng)絡(luò)架構(gòu)、集群網(wǎng)絡(luò)配置規(guī)劃。
Isilon集群存儲(chǔ)網(wǎng)絡(luò)架構(gòu)主要分為內(nèi)部網(wǎng)絡(luò)和外部網(wǎng)絡(luò)。
5.1.1 內(nèi)部網(wǎng)絡(luò)架構(gòu)
內(nèi)部網(wǎng)絡(luò)由 Infiniband高速網(wǎng)絡(luò)互聯(lián)。每個(gè)X410節(jié)點(diǎn)的 2個(gè)高速網(wǎng)口分別接入 2個(gè)Infiniband交換機(jī),如圖1所示。
5.1.2 外部網(wǎng)絡(luò)架構(gòu)
每個(gè)X410節(jié)點(diǎn)2個(gè)萬(wàn)兆網(wǎng)口接入核心交換機(jī)。擴(kuò)容后外部網(wǎng)絡(luò)架構(gòu)圖如圖2所示。
集群SVIP(對(duì)外提供服務(wù)的統(tǒng)一IP地址)不變,延用原來(lái)的172.27.124.10。對(duì)新增X410節(jié)點(diǎn)的2個(gè)萬(wàn)兆網(wǎng)口進(jìn)行網(wǎng)絡(luò)IP配置,擴(kuò)容后萬(wàn)兆IP地址段為172.27.124.11-172.27.124.32。
圖1 擴(kuò)容前后內(nèi)部網(wǎng)絡(luò)架構(gòu)對(duì)比圖Fig.1 Comparison of internal network architecture before and after capacity expansion
圖2 擴(kuò)容后外部網(wǎng)絡(luò)架構(gòu)圖Fig.2 External network architecture after capacity expansion
圖3 存儲(chǔ)實(shí)際可用空間示例圖Fig.3 Diagram of actual available storage space
基于 Isilon集群存儲(chǔ)的技術(shù)優(yōu)勢(shì),2次擴(kuò)容均在不影響客戶端使用的情況下進(jìn)行,相比于原新聞部的CX-960存儲(chǔ),原新聞?lì)l道的 VNX-5700存儲(chǔ)、新聞云 Isilon存儲(chǔ)系統(tǒng)容量大幅提升,如圖 3所示。擴(kuò)容后,整個(gè)Isilon存儲(chǔ)系統(tǒng)共配置11個(gè)X410節(jié)點(diǎn)(包括 22個(gè)千兆和 22個(gè)萬(wàn)兆網(wǎng)絡(luò)接口,396塊 4G硬盤(pán)),2個(gè) Infiniband交換機(jī)。在第 2次擴(kuò)容時(shí),在線將數(shù)據(jù)保護(hù)模式改為 8+3,可用空間 1.4PB。以一個(gè)Isilon存儲(chǔ)節(jié)點(diǎn)對(duì)外存取帶寬500MB/s計(jì)算,系統(tǒng)內(nèi)11個(gè)節(jié)點(diǎn)的總帶寬共5500MB/s。
擴(kuò)容后的新聞云存儲(chǔ)系統(tǒng),是一個(gè)由11個(gè)EMC Isilon X410節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)包括36塊 4GB SATA硬盤(pán),2個(gè)千兆網(wǎng)卡,2個(gè)萬(wàn)兆網(wǎng)卡),2個(gè)infiniband交換機(jī)組成,并定制安裝了SmartConnect Advanced(動(dòng)態(tài)客戶端負(fù)載平衡功能)、SmartQuota(配額限制功能)、InsightIQ(集群監(jiān)控功能)軟件的,基于開(kāi)放式架構(gòu),使用分布式操作系統(tǒng),統(tǒng)一命名空間的存儲(chǔ)系統(tǒng)。它擁有易于安裝、配置,便于管理、擴(kuò)容的優(yōu)點(diǎn),并且在負(fù)載均衡、系統(tǒng)性能、數(shù)據(jù)安全方面有卓越表現(xiàn)。相比原來(lái)的存儲(chǔ)系統(tǒng),新集群存儲(chǔ)系統(tǒng)提供大容量存儲(chǔ)、高帶寬讀寫(xiě),在線擴(kuò)容、更改保護(hù)級(jí)別外,有效提高了磁盤(pán)空間利用率,解決了lun在不同控制器切換帶來(lái)的訪問(wèn)隱患,避免了讀寫(xiě)單點(diǎn)故障,合理均衡了多用戶使用的負(fù)載情況。自 2017年上線后,除操作系統(tǒng)升級(jí)、硬盤(pán)等硬件的更換維護(hù),一直平穩(wěn)運(yùn)行,從未出現(xiàn)過(guò)安全事故,為新聞節(jié)目的高效制播提供了保障。