易傳美,劉世峰,孫啟昌
(中國移動(dòng)通信集團(tuán)河南有限公司,鄭州 450008)
目前移動(dòng)話音類增值業(yè)務(wù)需要核心網(wǎng)進(jìn)行智能觸發(fā)至智能網(wǎng)平臺(tái),再通過智能網(wǎng)平臺(tái)為用戶提供各種豐富的話音增值服務(wù)。中國移動(dòng)自1999年開展智能網(wǎng)業(yè)務(wù)以來,業(yè)務(wù)種類不斷增多,智能用戶規(guī)模不斷擴(kuò)大,移動(dòng)智能網(wǎng)的網(wǎng)絡(luò)地位越來越顯得重要。保持智能業(yè)務(wù)高質(zhì)量、穩(wěn)定可靠的運(yùn)行是網(wǎng)絡(luò)維護(hù)工作的重要目標(biāo)之一。
現(xiàn)在智能網(wǎng)系統(tǒng)核心設(shè)備業(yè)務(wù)控制點(diǎn)一直采用多點(diǎn)分區(qū)方式承載業(yè)務(wù),每套業(yè)務(wù)控制點(diǎn)單點(diǎn)獨(dú)立運(yùn)行,對(duì)于大規(guī)模用戶的業(yè)務(wù)如虛擬專用移動(dòng)網(wǎng)(VPMN)業(yè)務(wù),每套SCP各自承載某一個(gè)業(yè)務(wù)區(qū)或幾個(gè)業(yè)務(wù)區(qū)的虛擬專用移動(dòng)網(wǎng)用戶。這種單點(diǎn)SCP獨(dú)立運(yùn)行在一定程度上存在較大的災(zāi)難隱患,單點(diǎn)SCP軟件或硬件故障有可能導(dǎo)致所轄區(qū)域業(yè)務(wù)用戶不能進(jìn)行通話或者使用話音增值業(yè)務(wù),有可能產(chǎn)生大量直接或間接的各種損失。因此,在中國移動(dòng)智能網(wǎng)中有必要針對(duì)智能網(wǎng)核心設(shè)備SCP建立容災(zāi)系統(tǒng),以便進(jìn)行動(dòng)態(tài)數(shù)據(jù)備份,并在生產(chǎn)設(shè)備發(fā)生災(zāi)難時(shí),快速接管智能業(yè)務(wù)。
現(xiàn)階段對(duì)業(yè)務(wù)控制點(diǎn)的容災(zāi)備份組網(wǎng)方案一般有以下3種。
(1)循環(huán)容災(zāi)備份方案,各生產(chǎn)設(shè)備之間互相容災(zāi)備份,每臺(tái)設(shè)備在容災(zāi)其它設(shè)備的同時(shí)又作為主用系統(tǒng)承擔(dān)部分智能業(yè)務(wù)。SCP上的相關(guān)業(yè)務(wù)數(shù)據(jù)可以依賴于業(yè)務(wù)管理點(diǎn)(SMP)實(shí)時(shí)分發(fā)或者后臺(tái)應(yīng)用進(jìn)行定時(shí)導(dǎo)入。從處理能力上考慮,各SCP需留被容災(zāi)SCP的業(yè)務(wù)處理能力,例如當(dāng)SCP2作為SCP1的容災(zāi)節(jié)點(diǎn)時(shí),SCP2考慮的處理能力應(yīng)該為SCP2話務(wù)量+SCP1話務(wù)量。
(2)1+1容災(zāi)備份方案,對(duì)每一套生產(chǎn)系統(tǒng)均建設(shè)一套容災(zāi)系統(tǒng)對(duì)其進(jìn)行容災(zāi),采用專用路由完成生產(chǎn)系統(tǒng)與容災(zāi)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)同步,在正常情況下,只有生產(chǎn)系統(tǒng)承載業(yè)務(wù),容災(zāi)系統(tǒng)保持空轉(zhuǎn),隨時(shí)準(zhǔn)備接管生產(chǎn)系統(tǒng)上的業(yè)務(wù)。該方案可以實(shí)現(xiàn)遠(yuǎn)程容災(zāi)。
(3)N+1容災(zāi)備份方案,一套容災(zāi)系統(tǒng)對(duì)N臺(tái)生產(chǎn)系統(tǒng)進(jìn)行容災(zāi),采用專用路由完成生產(chǎn)系統(tǒng)與容災(zāi)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)同步,比較適合用于對(duì)多臺(tái)設(shè)備的容災(zāi),可以實(shí)現(xiàn)遠(yuǎn)程容災(zāi)。
由于循環(huán)容災(zāi)備份方案存在以下缺點(diǎn),在現(xiàn)網(wǎng)一般不采用:每個(gè)容災(zāi)節(jié)點(diǎn)SCP的處理能力需要考慮被容災(zāi)設(shè)備話務(wù)量+容災(zāi)設(shè)備本身話務(wù)量,要求SCP容量保持比較大的富余,設(shè)備資源浪費(fèi)較大,當(dāng)業(yè)務(wù)量增大時(shí),也并不能節(jié)省投資;循環(huán)容災(zāi)備份方案的容災(zāi)鏈可能導(dǎo)致智能網(wǎng)系統(tǒng)的連環(huán)癱機(jī),比較危險(xiǎn)。
現(xiàn)網(wǎng)一般采用1+1容災(zāi)備份方案或N+1容災(zāi)備份方案,據(jù)統(tǒng)計(jì),現(xiàn)網(wǎng)需要容災(zāi)的生產(chǎn)系統(tǒng)只有1套時(shí),一般采用1+1容災(zāi)備份;現(xiàn)網(wǎng)需要容災(zāi)的生產(chǎn)系統(tǒng)套數(shù)較多時(shí),一般采用N+1容災(zāi)備份?,F(xiàn)網(wǎng)業(yè)務(wù)控制點(diǎn)采用的容災(zāi)備份方案,存在以下缺點(diǎn)。
(1)1+1容災(zāi)備份方案正常情況下業(yè)務(wù)全部有1套生產(chǎn)系統(tǒng)承擔(dān),容災(zāi)系統(tǒng)完全處于空轉(zhuǎn)或輕載狀態(tài),設(shè)備負(fù)荷十分不均,設(shè)備利用率非常低,投資大。因此該方案一般只限于需要容災(zāi)的生產(chǎn)系統(tǒng)只有1套且非常重要時(shí)采用。
(2)N+1(N>1)容災(zāi)備份方案,需要容災(zāi)的生產(chǎn)系統(tǒng)大于1套時(shí),一般采用該方案。該方案要求容災(zāi)系統(tǒng)處于空轉(zhuǎn)或輕載狀態(tài),N較大時(shí),同時(shí)容災(zāi)性能將下降,多個(gè)設(shè)備出現(xiàn)問題時(shí),同時(shí)接管多個(gè)生產(chǎn)系統(tǒng)對(duì)本身處理能力要求高,要求一套容災(zāi)設(shè)備的處理能力能達(dá)到多個(gè)故障設(shè)備處理能力的總和,或者需要建多套容災(zāi)設(shè)備來容災(zāi)這N套設(shè)備,投資也會(huì)隨之增大。
無論是1+1容災(zāi)備份方案還是N+1容災(zāi)備份方案,都需要有一個(gè)空轉(zhuǎn)或輕載設(shè)備作為容災(zāi)設(shè)備,存在著設(shè)備負(fù)荷不均衡,設(shè)備利用率低,設(shè)備資源浪費(fèi)較大的缺點(diǎn),當(dāng)N+1方案里的多套設(shè)備故障時(shí),容災(zāi)系統(tǒng)的接管能力也將受限。
針對(duì)上述方案存在的缺陷,本論述將提供一種針對(duì)業(yè)務(wù)控制點(diǎn)容災(zāi)問題的負(fù)荷分擔(dān)組網(wǎng)解決方案,通過采用虛擬全局碼GT,將多套業(yè)務(wù)控制點(diǎn)SCP組成一個(gè)負(fù)荷分擔(dān)的集群組,同一個(gè)集群組里的每個(gè)業(yè)務(wù)控制點(diǎn)加載相同的業(yè)務(wù)邏輯和業(yè)務(wù)數(shù)據(jù),用戶數(shù)據(jù)也同時(shí)分發(fā)到集群組里的所有業(yè)務(wù)控制點(diǎn),集群組里的業(yè)務(wù)控制點(diǎn)分布在不同的機(jī)房,負(fù)荷分擔(dān)處理觸發(fā)上來的呼叫,其中任何一個(gè)業(yè)務(wù)控制點(diǎn)或任何一個(gè)機(jī)房的設(shè)備故障時(shí),業(yè)務(wù)自動(dòng)切換到集群組里的其它業(yè)務(wù)控制點(diǎn),由其它的業(yè)務(wù)控制點(diǎn)共同負(fù)荷分擔(dān)處理業(yè)務(wù),不影響業(yè)務(wù)。從而在不閑置設(shè)備的情況下,有效解決業(yè)務(wù)控制點(diǎn)的容災(zāi)問題。
圖1 現(xiàn)階段SCP組網(wǎng)方案
將傳統(tǒng)的SCP多點(diǎn)分區(qū)承載組網(wǎng)方式(如圖1所示)改為SCP多點(diǎn)負(fù)荷分擔(dān)組網(wǎng)方式,如圖2所示, 一個(gè)SCP負(fù)荷分擔(dān)集群組包括n個(gè)SCP站點(diǎn),集群組引入虛擬GT0,由整個(gè)集群組共同承載全省或n個(gè)區(qū)的某一項(xiàng)業(yè)務(wù),只需將智能網(wǎng)用戶簽約到GT0即可,同一個(gè)集群組里的每個(gè)SCP加載相同的業(yè)務(wù)邏輯和業(yè)務(wù)數(shù)據(jù),用戶數(shù)據(jù)由SMP同時(shí)分發(fā)到集群組里的所有SCP,集群組里的SCP負(fù)荷分擔(dān)處理觸發(fā)上來的呼叫。SCP站點(diǎn)分布在不同的機(jī)房,SCP任何一個(gè)設(shè)備故障均不影響業(yè)務(wù)(下圖以所有端局都通過信令轉(zhuǎn)接點(diǎn)(STP)轉(zhuǎn)接到SCP為例,其它信令組網(wǎng)方式原理相同)。
圖2 SCP新組網(wǎng)方案
負(fù)荷分擔(dān)集群組各SCP配置共同的虛擬GT0,每個(gè)站點(diǎn)的實(shí)際GT仍然是不同的(GT1、GT2……GTn),所有業(yè)務(wù)用戶均簽約到虛擬GT0,STP根據(jù)負(fù)荷分擔(dān)原則將GT0分別翻譯到該集群組內(nèi)的各個(gè)目的信令點(diǎn)(DPC),實(shí)現(xiàn)信令轉(zhuǎn)接點(diǎn)將GT0負(fù)荷分擔(dān)到該集群組里的各個(gè)SCP (集群組SCP的數(shù)量應(yīng)考慮本省STP支持GT到DPC負(fù)荷分擔(dān)的數(shù)量、SCP數(shù)據(jù)的查詢效率因素),SCP收到首消息后把GT0識(shí)別為自己的GT。 根據(jù)協(xié)議規(guī)范,首消息的地址可以不是真實(shí)的地址,在響應(yīng)側(cè)回真實(shí)地址后,整個(gè)對(duì)話鏈接才真正建立,后續(xù)都使用真實(shí)地址進(jìn)行通信,這些移動(dòng)交換中心(MSC)都支持,也是 handover方式的實(shí)現(xiàn)基礎(chǔ)。
呼叫從MSC發(fā)起后,第一條消息經(jīng)過MSC→STP→SCP的過程由STP隨機(jī)送到SCPx,使用虛擬GT0,然后SCPx回的響應(yīng)消息中使用實(shí)際GTx;第二條消息隨機(jī)到達(dá)STP后,按照消息中攜帶的實(shí)際GTx來路由,即GT1翻譯到SCP1 ,GT2翻譯到SCP2,保證一個(gè)呼叫的所有消息到達(dá)同一個(gè)SCP;SCP1或SCPn故障后,STP將所有消息分發(fā)到該集群組內(nèi)剩余其它SCP上。
承載用戶時(shí)首次采用手工全量導(dǎo)入方法導(dǎo)入本集群組內(nèi)所有用戶數(shù)據(jù),后期則由SMP向各SCP實(shí)時(shí)同步變更的用戶數(shù)據(jù)。
SMP向集群內(nèi)所有SCP發(fā)出修改本集群組內(nèi)所承載用戶數(shù)據(jù)的請(qǐng)求,使得SMP數(shù)據(jù)庫和各個(gè)SCP的數(shù)據(jù)保持完全一致性。
在單個(gè)SCP升級(jí)或故障時(shí)采用“緩存同步”技術(shù),SMP自動(dòng)將故障SCP狀態(tài)設(shè)置為broken,由SMP將指令存在緩存中,當(dāng)SCP恢復(fù)連接后SMP修改SCP狀態(tài)為同步,重新發(fā)送緩存中的指令。SMP緩存中可以存放的指令數(shù)量可以根據(jù)實(shí)際情況設(shè)置。
當(dāng)緩存達(dá)到一定數(shù)量(例如60%、80%、100%)可以上報(bào)不同級(jí)別的告警,告警閾值可以自己設(shè)置。
在業(yè)務(wù)設(shè)計(jì)時(shí)考慮可能承載的用戶數(shù)據(jù)量,對(duì)集群內(nèi)用戶數(shù)據(jù)在500萬(可結(jié)合數(shù)據(jù)訪問效率實(shí)際情況界定)以下時(shí),采用全號(hào)段放置模式。所有用戶數(shù)據(jù)不分號(hào)段,分布在同一張用戶表中。對(duì)容量超過500萬(可結(jié)合數(shù)據(jù)訪問效率實(shí)際情況界定)的用戶數(shù)據(jù)采用號(hào)段分配模式,按號(hào)段分布在SCP上不同的用戶表中,以便提高SCP大容量數(shù)據(jù)訪問效率。
負(fù)荷分擔(dān)集群組里SCP站點(diǎn)分布在不同的機(jī)房,其中任何一個(gè)生產(chǎn)機(jī)或任何一個(gè)機(jī)房的設(shè)備故障時(shí),業(yè)務(wù)自動(dòng)切換到集群里其它的生產(chǎn)機(jī),由其它的生產(chǎn)機(jī)共同負(fù)荷分擔(dān)處理業(yè)務(wù),不影響業(yè)務(wù),防止SCP的單點(diǎn)故障影響用戶業(yè)務(wù)使用。
管理者可以定義在呼叫、數(shù)據(jù)訪問或其它情況下的容災(zāi)切換檢測(cè)機(jī)制。容災(zāi)切換的方式可以有自動(dòng)切換和手工切換兩種:可以配置是否支持自動(dòng)切換,若配置為支持自動(dòng)切換,在呼叫、數(shù)據(jù)訪問或其它情況滿足管理者定義的規(guī)則后觸發(fā)容災(zāi)切換條件后,將自動(dòng)發(fā)生容災(zāi)切換;也可以通過網(wǎng)管系統(tǒng)手工操作,進(jìn)行容災(zāi)的切換,手工切換的對(duì)象可以是單套SCP也可以是集群中的多套SCP。
該組網(wǎng)方案可以應(yīng)用到以下業(yè)務(wù)SCP。
(1)現(xiàn)網(wǎng)用戶數(shù)據(jù)參數(shù)(包括賬戶余額、剩余免費(fèi)時(shí)長、充值卡狀態(tài)標(biāo)志)不隨呼叫實(shí)時(shí)改變的業(yè)務(wù)SCP,如沒有包月時(shí)長的VPMN業(yè)務(wù)SCP、計(jì)費(fèi)已遷移到BOSS的業(yè)務(wù)SCP。
(2)沒有用戶數(shù)據(jù)的業(yè)務(wù)SCP,如欠費(fèi)風(fēng)險(xiǎn)控制業(yè)務(wù)、統(tǒng)一充值業(yè)務(wù)。
與傳統(tǒng)的SCP多點(diǎn)分區(qū)承載業(yè)務(wù)用戶相比,該負(fù)荷分擔(dān)集群組網(wǎng)方案存在以下幾個(gè)主要的優(yōu)點(diǎn)。
首先,該方案可以大大提高各SCP設(shè)備的利用率,均衡各SCP的負(fù)荷,降低用戶搬遷頻次,節(jié)省投資。如現(xiàn)網(wǎng)900萬的用戶按照70%的設(shè)備利用率來放置到SCP,若采用負(fù)荷分擔(dān)集群組網(wǎng),則共需要容量1 285萬,僅需13套100萬容量的SCP來承載,且集群組內(nèi)的13套設(shè)備負(fù)荷分擔(dān)處理呼叫,每套SCP設(shè)備的利用率都可以保持在69%左右;若采用SCP多點(diǎn)分區(qū)承載,通過人為分配用戶到各SCP,不可能把900萬用戶完全平均的分配到各SCP承載,根據(jù)現(xiàn)網(wǎng)實(shí)際運(yùn)行情況來看,最好的均衡效果也至少需要15套100萬容量的SCP來分別承載,各SCP平均設(shè)備利用率能達(dá)到60%左右,而且隨著各業(yè)務(wù)區(qū)用戶數(shù)的變化,即使用戶總數(shù)沒變,也還需通過不斷的用戶搬遷調(diào)整來均衡各SCP負(fù)荷。
其次,該方案不需額外新建設(shè)備對(duì)該組內(nèi)的設(shè)備進(jìn)行應(yīng)用級(jí)容災(zāi)備份,負(fù)荷分擔(dān)的SCP分布在不同地理位置的機(jī)房,不用再另外單獨(dú)部署容災(zāi)設(shè)備,就能實(shí)現(xiàn)業(yè)務(wù)的地理容災(zāi),保證了設(shè)備業(yè)務(wù)的安全性,大大節(jié)省了容災(zāi)建設(shè)的投資成本。如第二點(diǎn)里提到的900萬用戶,若采用15套SCP多點(diǎn)分區(qū)承載方式,由于SCP故障后只能將整個(gè)故障SCP的話務(wù)指向容災(zāi)SCP,至少再新建1套100萬容量的SCP來容災(zāi),且這1套容災(zāi)設(shè)備只能同時(shí)容災(zāi)1套生產(chǎn)SCP。若采用13套SCP負(fù)荷分擔(dān)集群組方式承載,由于故障SCP的話務(wù)會(huì)被平均分?jǐn)偟浇M內(nèi)其它SCP,則在不新建設(shè)備的情況下也能實(shí)現(xiàn)容災(zāi),能同時(shí)容災(zāi)的設(shè)備套數(shù)及設(shè)備利用率情況如表1所示。
表1 容災(zāi)故障SCP情況
由于SCP處理能力和容量設(shè)計(jì)已經(jīng)考慮了話務(wù)高峰的情況,所以SCP平常的實(shí)際處理能力能滿足設(shè)備利用率為100%的要求。從表1可以得出,在非話務(wù)高峰時(shí)段,最多可以同時(shí)容災(zāi)4套故障SCP,在話務(wù)高峰時(shí)段最多也能同時(shí)容災(zāi)3套SCP。如果13套設(shè)備平均分布在3個(gè)不同物理位置的機(jī)房,則在不新建設(shè)備的情況下不但能實(shí)現(xiàn)單套SCP故障的容災(zāi),而且還幾乎能實(shí)現(xiàn)單個(gè)機(jī)房所有SCP故障的容災(zāi)。
第三,該方案降低了用戶搬遷難度,節(jié)約了人力和時(shí)間。隨著用戶數(shù)的增加,各業(yè)務(wù)區(qū)不會(huì)因?yàn)閱翁譙CP的處理能力達(dá)到上限而進(jìn)行頻繁的用戶割接數(shù)據(jù)修改,只需在該集群組內(nèi)新擴(kuò)容SCP,然后將該集群組內(nèi)的用戶數(shù)據(jù)導(dǎo)入新設(shè)備即可,不再需要各業(yè)務(wù)區(qū)修改用戶簽約的GT碼,從而大大節(jié)約了人力、時(shí)間,降低了用戶搬遷難度。
第四,該方案大大提高了應(yīng)對(duì)話務(wù)高峰的沖擊能力。由于采取了負(fù)荷分擔(dān)處理呼叫的方式,單個(gè)地區(qū)或幾個(gè)地區(qū)的高話務(wù)并不能對(duì)整個(gè)集群組內(nèi)SCP造成大的沖擊。
本文詳細(xì)從組網(wǎng)、數(shù)據(jù)同步、數(shù)據(jù)放置等方面闡述了SCP容災(zāi)備份負(fù)荷分擔(dān)組網(wǎng)方案的實(shí)現(xiàn)方案。此方案在集團(tuán)重點(diǎn)課題2011_LH_25《智能網(wǎng)多次業(yè)務(wù)觸發(fā)機(jī)制及安全性保障研究》中已研究應(yīng)用到業(yè)務(wù)中間件SCOM組網(wǎng)中,并在河南測(cè)試通過,后續(xù)在欠費(fèi)風(fēng)險(xiǎn)控制業(yè)務(wù)SCP、統(tǒng)一充值業(yè)務(wù)SCP中也投入使用,并取得了良好的效果。從移動(dòng)智能網(wǎng)的發(fā)展趨勢(shì)來看,以后新業(yè)務(wù)將趨向于放在BOSS批價(jià)計(jì)費(fèi),目前已有業(yè)務(wù)如VPMN業(yè)務(wù)的計(jì)費(fèi)也正在陸續(xù)搬遷到BOSS實(shí)現(xiàn),因此SCP負(fù)荷分擔(dān)集群組網(wǎng)方案的應(yīng)用空間將會(huì)越來越大。
[1]中國移動(dòng)智能網(wǎng)設(shè)備冗災(zāi)建議書[Z]. 2011,2.
[2]廖建新. 移動(dòng)智能網(wǎng)[M]. 北京:北京郵電大學(xué)出版社有限公司,2000,11.
[3]康曉非,暴宇. 數(shù)字移動(dòng)通信[M]. 北京:人民郵電出版社,2010,8.
[4]何歡,何倩. 數(shù)據(jù)備份與恢復(fù)[M]. 北京:機(jī)械工業(yè)出版社,2010,9.
[5]中華人民共和國信息產(chǎn)業(yè)部,中國國內(nèi)電話網(wǎng)No.7信號(hào)方式技術(shù)規(guī)范[S]. GF 001-9001.