亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于強化學(xué)習(xí)的CBTC 系統(tǒng)信息安全風(fēng)險評估方法

        2024-03-25 06:34:18李寧
        電子設(shè)計工程 2024年6期
        關(guān)鍵詞:模型系統(tǒng)

        李寧

        (北京地鐵科技發(fā)展有限公司,北京 101399)

        目前,在城市軌道交通中應(yīng)用最為廣泛的是基于通信的列車運行控制(Communication Based Train Control,CBTC)系統(tǒng)[1],其使用的大量信息化組件易被黑客攻擊,進而可能導(dǎo)致安全事故。

        目前,一些傳統(tǒng)信息技術(shù)(Information Technology,IT)領(lǐng)域中的方法被應(yīng)用于評估CBTC 系統(tǒng)信息安全風(fēng)險,如文獻[2]分析了CBTC 系統(tǒng)中攻防雙方動態(tài)交互下的信息安全風(fēng)險;文獻[3]基于攻擊樹分析了CBTC 系統(tǒng)中攻擊發(fā)生的概率,并分析了攻擊造成的影響;文獻[4]借助網(wǎng)絡(luò)拓撲的二維結(jié)構(gòu)熵分析攻擊對CBTC 系統(tǒng)所造成的影響。

        該文根據(jù)CBTC 系統(tǒng)信息物理融合、降級運營等特點設(shè)計了與其相適配的信息安全風(fēng)險評估方法,并首次基于強化學(xué)習(xí)方法來確定CBTC系統(tǒng)的風(fēng)險值。

        1 CBTC系統(tǒng)

        基于通信的列車運行控制(Communication Based Train Control,CBTC)系統(tǒng)可分為信息域和物理域,其中信息域的設(shè)備組成又分為地面和車載兩類,如圖1所示。地面設(shè)備包括列車自動監(jiān)控(Automatic Train Supervision,ATS)、計算機聯(lián)鎖(Computer Interlock,CI)、區(qū)域控制器(Zone Controller,ZC)、數(shù)據(jù)存儲單元(Data Storage Unit,DSU)等,負責(zé)為列車計算移動授權(quán)(Movement Authority,MA);車載控制器(Vehicle On Board Controller,VOBC)則根據(jù)MA 計算控制命令[5]。

        圖1 CBTC系統(tǒng)基本架構(gòu)

        CBTC 系統(tǒng)物理域列車運營模式等級有三種,從高到低分別是連續(xù)式通信級(CBTC)、點式通信級(ITC)、聯(lián)鎖級(IL)[6]。物理域中列車運營模式的實現(xiàn)需要信息域中的設(shè)備提供支持,當(dāng)信息域中的設(shè)備全都正常工作時,物理域中的列車能夠以最高的CBTC 級別運營;如果黑客攻擊信息域中的設(shè)備,物理域列車將降級到ITC 級別,甚至IL 級別運營[7]。

        CBTC 系統(tǒng)信息域中不可避免地存在信息安全脆弱性(漏洞),包括通信協(xié)議、操作系統(tǒng)和應(yīng)用軟件等[8-11],而黑客可能利用這些漏洞,造成列車運行過程中的機密數(shù)據(jù)被篡改或者設(shè)備無法正常工作等后果。

        2 CBTC系統(tǒng)風(fēng)險評估方法

        2.1 CBTC系統(tǒng)網(wǎng)絡(luò)模型構(gòu)建

        CBTC 系統(tǒng)信息域中的設(shè)備數(shù)量眾多,而且這些設(shè)備之間的數(shù)據(jù)通信關(guān)系也十分復(fù)雜。因此,該文利用復(fù)雜網(wǎng)絡(luò)理論將CBTC 系統(tǒng)信息域中的設(shè)備抽象為節(jié)點、設(shè)備之間的數(shù)據(jù)傳輸關(guān)系抽象為邊[12],定義CBTC 系統(tǒng)信息域的網(wǎng)絡(luò)模型如下:

        其中,Nodes 表示設(shè)備節(jié)點集合;Edges 表示任意節(jié)點之間的數(shù)據(jù)傳輸邊的集合。

        CBTC 系統(tǒng)網(wǎng)絡(luò)模型中不同數(shù)據(jù)傳輸邊所采用的通信方式、頻率等差別較大,例如ZC 可以通過無線局域網(wǎng)技術(shù)向VOBC 周期發(fā)送數(shù)據(jù),而CI 計算的MA 數(shù)據(jù)只能通過應(yīng)答器的方式間歇性傳輸給VOBC。因此,通過賦予權(quán)重來加以區(qū)分CBTC 系統(tǒng)網(wǎng)絡(luò)模型中的不同數(shù)據(jù)傳輸邊,邊的權(quán)值越大,代表其傳輸?shù)臄?shù)據(jù)對列車運營控制等級的影響程度越高。CBTC 系統(tǒng)網(wǎng)絡(luò)模型中不同節(jié)點對列車運營控制等級的重要程度也相差較大,通過度來衡量節(jié)點的重要程度,計算如下:

        其中,dj表示CBTC 網(wǎng)絡(luò)模型中的第j個節(jié)點的度,是以它為頂點的所有邊的權(quán)和;wi表示與該節(jié)點相連的第i條邊的權(quán)重;n表示與該節(jié)點相連的所有邊的數(shù)目。

        在CBTC 系統(tǒng)網(wǎng)絡(luò)模型中傳輸?shù)臄?shù)據(jù)類型眾多,但重要程度最高的就是與列車運行控制相關(guān)的數(shù)據(jù),包括MA、信號燈、道岔、列車位置、進路等數(shù)據(jù)。當(dāng)CBTC 系統(tǒng)信息域中節(jié)點和邊全都正常工作時,線路上的列車都能以最高的CBTC 等級控制運營;當(dāng)信息域中與列車運行控制相關(guān)的節(jié)點或邊被攻擊而無法正常工作時,線路上的列車將會降級運營。因此,根據(jù)節(jié)點度和邊權(quán)重來定義CBTC 系統(tǒng)信息域復(fù)雜網(wǎng)絡(luò)模型的連通性能如下所示:

        其中,WO、DO分別表示系統(tǒng)信息域未遭受攻擊時節(jié)點度之和與邊權(quán)重之和;n表示信息域所包含邊的數(shù)目,wi表示其中第i條邊的權(quán)重;m表示信息域所包含節(jié)點的數(shù)目,dj表示其中第j個節(jié)點的度;cty(G)表示系統(tǒng)信息域網(wǎng)絡(luò)連通性,網(wǎng)絡(luò)的連通性越高,代表系統(tǒng)能夠?qū)崿F(xiàn)的列車控制運營等級也越高。

        2.2 CBTC系統(tǒng)信息安全風(fēng)險值計算

        根據(jù)信息安全風(fēng)險評估規(guī)范可知,信息安全風(fēng)險值等于攻擊事件發(fā)生的概率和攻擊事件所造成影響的乘積[13]。因此,首先定義CBTC 系統(tǒng)復(fù)雜網(wǎng)絡(luò)中攻擊單個節(jié)點或邊的信息安全風(fēng)險值如下:

        其中,A表示單個節(jié)點或邊被攻擊的安全事件,PA表示該攻擊事件發(fā)生的概率,EA表示該攻擊事件所造成的影響,R(A)表示該攻擊事件的信息安全風(fēng)險值。

        攻擊事件的概率可以借助通用漏洞評分系統(tǒng)(Common Vulnerability Scoring System,CVSS)確定,在CVSS 規(guī)范中給出了有關(guān)漏洞可利用性的評價指標,分別是攻擊途徑(Attack Vector,AV)、攻擊復(fù)雜度(Attack Complexity,AC)、攻擊權(quán)限要求(Privilege Required,PR)、攻擊是否需要用戶交互(User Interface,UI),并且對每個評價指標的不同等級賦予分數(shù)[14],得到的漏洞可利用性評價標準如表1 所示。

        表1 CVSS漏洞評價指標

        一般而言,CBTC 系統(tǒng)網(wǎng)絡(luò)模型的節(jié)點或邊中可能存在的漏洞不止一個,然而在收益相同的情況下,一個理性的黑客通常會選擇最容易被利用的漏洞,因此可得到單個攻擊事件發(fā)生的概率為:

        其中,ei表示節(jié)點或邊上存在的某一漏洞;AV、AC、PR、UI 分別表示該漏洞的攻擊途徑、攻擊復(fù)雜度、攻擊權(quán)限要求、是否需要用戶交互;M 是值為2.11 的常數(shù);P(ei)表示漏洞ei被攻擊的概率;PA表示節(jié)點或邊被攻擊的概率。

        一般情況下,CBTC 系統(tǒng)運營管理者最為關(guān)心的是網(wǎng)絡(luò)攻擊對列車運營控制的影響。由前文可知,當(dāng)CBTC 系統(tǒng)網(wǎng)絡(luò)模型中的節(jié)點或邊被攻擊而無法正常工作后,除了直接導(dǎo)致網(wǎng)絡(luò)連通性下降之外,還會進一步將影響傳導(dǎo)至物理域,引起列車運營控制等級下降。因此,網(wǎng)絡(luò)連通性能不僅可以反應(yīng)節(jié)點和邊的工作狀態(tài),還能一定程度上反映列車運營狀態(tài),該文定義CBTC 系統(tǒng)連通性能的下降作為攻擊事件所造成的影響,如下所示:

        其中,EA表示攻擊事件A對CBTC 系統(tǒng)造成的影響;cty(G)表示攻擊前的系統(tǒng)連通性能;cty′(G)表示攻擊事件發(fā)生后的系統(tǒng)連通性能。

        黑客不會止步于第一次攻擊的節(jié)點或邊,而會嘗試深入攻擊CBTC 系統(tǒng)網(wǎng)絡(luò)模型中的其他節(jié)點與邊。隨著攻擊路徑的深入,黑客實施攻擊的累積成本和難度也會逐漸增大,定義一條攻擊路徑的信息安全風(fēng)險值為:

        其中,R(H)表示攻擊路徑H的信息安全風(fēng)險值;PAh表示該攻擊路徑中第h個攻擊事件發(fā)生的概率;EAh表示該攻擊路徑中第h個攻擊事件造成的影響。

        一個系統(tǒng)的信息安全水平由其中最薄弱的環(huán)節(jié)決定,即CBTC 系統(tǒng)的信息安全風(fēng)險取決于風(fēng)險值最大的攻擊路徑。然而,CBTC 系統(tǒng)網(wǎng)絡(luò)模型中的節(jié)點與邊的數(shù)量眾多,所以攻擊路徑數(shù)量也十分龐大。此外,根據(jù)前文分析可知,在一條攻擊路徑中,越靠后的攻擊事件實施難度越高,相應(yīng)的信息安全風(fēng)險值增長越緩慢,所以攻擊路徑中每一步的目標選擇都至關(guān)重要。因此,該文將列控系統(tǒng)的信息安全風(fēng)險評估問題等效為搜索一條最優(yōu)攻擊路徑,描述如下:

        其中,H*表示CBTC 系統(tǒng)中信息安全風(fēng)險值最大的攻擊路徑;W表示系統(tǒng)中總共的攻擊路徑數(shù)目;Hk表示系統(tǒng)中的第k條攻擊路徑。

        2.3 基于強化學(xué)習(xí)的最優(yōu)攻擊路徑搜索

        強化學(xué)習(xí)(Reinforcement Learning,RL)包含智能體、環(huán)境、動作、策略、獎勵等基本要素,描述了智能體通過不斷嘗試以實現(xiàn)長期獎勵的最大化的過程[15]。目前,Q 學(xué)習(xí)(Q-learning)算法是強化學(xué)習(xí)中應(yīng)用較為廣泛的一種算法,它通過迭代訓(xùn)練Q-table來確定智能體的最優(yōu)策略[16]。

        該文應(yīng)用Q-learning 算法來搜索CBTC 系統(tǒng)中的最優(yōu)攻擊路徑,將黑客看作攻擊智能體,CBTC 系統(tǒng)視為環(huán)境,攻擊單個節(jié)點或邊看作是智能體的動作,并以信息安全風(fēng)險的增長值作為攻擊動作的獎勵。在初始時刻,Q-table 中的值設(shè)為0,隨后通過Bellman 方程計算每個攻擊動作的估計獎勵,具體描述如下:

        其中,v(sh,ah)表示在CBTC 系統(tǒng)在sh狀態(tài)下執(zhí)行攻擊動作ah的估計獎勵;rh表示當(dāng)前目標節(jié)點被攻擊的信息安全風(fēng)險;γ是折扣因子;maxQ(sh+1,a)表示在下一步攻擊動作集合中,選擇目標節(jié)點所能獲得風(fēng)險獎勵的最大值。

        隨后,根據(jù)每個攻擊動作的估計獎勵來更新Qtable,如下所示:

        其中,α表示學(xué)習(xí)速率,它是Q值更新速率的度量;Q(sh,ah)表示原Q-table 中的數(shù)值;Qnew表示更新之后的Q值。

        一般情況下,黑客會傾向于選擇CBTC 系統(tǒng)中估計獎勵值最大的節(jié)點或邊作為當(dāng)前攻擊目標,但是該目標可能僅是局部最優(yōu)選擇,因此為了尋找最優(yōu)攻擊路徑,還需以一個較小的概率來探索攻擊估計值較小的節(jié)點或邊,該文對常見的ε-greedy 貪心策略進行改進[17],如下所示:

        其中,ε為小于1 的正數(shù),用于調(diào)整搜索目標;N表示CBTC 系統(tǒng)當(dāng)前狀態(tài)下可以作為攻擊目標的節(jié)點數(shù)量;n*表示當(dāng)前估計獎勵值最大的節(jié)點;dj表示節(jié)點j的度,d表示剩余節(jié)點的度之和,可看出度越大的節(jié)點,則它被探索攻擊的可能性也越大。

        隨著訓(xùn)練次數(shù)的增多,攻擊智能體根據(jù)搜索策略得到的獎勵將會逐漸增大,當(dāng)攻擊路徑的獎勵值達到最大期望時,該路徑即為CBTC 系統(tǒng)中的一條最優(yōu)攻擊路徑,基于Q-learning 算法生成最優(yōu)攻擊路徑流程如下:

        1)構(gòu)造Q-table 矩陣,初始化Q(s,a)=0,給定參數(shù)ε、γ、α;

        2)選擇起始目標節(jié)點,并執(zhí)行攻擊;

        3)觀察當(dāng)前狀態(tài)sh,采用搜索策略確定下一步目標節(jié)點,并執(zhí)行攻擊動作;

        4)計算獎勵值rh,觀察新的狀態(tài)sh+1,估計新狀態(tài)下的最大獎勵;

        5)給定新的學(xué)習(xí)速率,更新Q值;

        6)判斷搜索是否結(jié)束,否則轉(zhuǎn)到第3)步,繼續(xù)搜索;

        7)判斷攻擊路徑累積獎勵是否滿足最大值期望,若不滿足,則轉(zhuǎn)到第2)步,開始新一輪訓(xùn)練,否則結(jié)束。

        3 實例分析

        該文借助一個CBTC 系統(tǒng)仿真平臺來驗證本文提出的信息安全風(fēng)險評估方法,該仿真平臺包含了四套CI、四套ZC、十套VOBC、一套中心ATS、四套軌旁設(shè)備仿真器等,線路參數(shù)選取了北京地鐵13 號線的部分區(qū)段,整條仿真線路被劃分為四個管轄區(qū)段,構(gòu)建實驗仿真平臺的復(fù)雜網(wǎng)絡(luò)模型,如圖2 所示。

        圖2 實驗平臺復(fù)雜網(wǎng)絡(luò)模型

        該實驗使用Nessus 漏洞掃描工具分析仿真平臺存在的漏洞,并基于CVSS 對這些漏洞進行打分,部分高危漏洞的統(tǒng)計結(jié)果如表2 所示。

        表2 高危漏洞描述

        一般情況下CBTC 系統(tǒng)的安全隔離性較好,除了內(nèi)部惡意人員之外,外部的攻擊者一般無法直接侵入內(nèi)網(wǎng)。因此實驗選取對外接口較多的中心ATS作為攻擊的起始點,基于強化學(xué)習(xí)模擬黑客,并應(yīng)用Q-learning 算法搜索得到最優(yōu)攻擊路徑,具體步驟如下:

        1)模擬黑客攻擊中心ATS,利用“永恒之藍”漏洞(CVE-2017-0144),獲取管理員控制權(quán)限;

        2)模擬黑客攻擊CI1,通過利用ARP 漏洞(CVE-2013-6014),使得CI1 無法與其他設(shè)備正常通信;

        3)模擬黑客攻擊軌旁設(shè)備仿真器2,利用“永恒之藍”漏洞(CVE-2017-0144),關(guān)閉該設(shè)備上的應(yīng)用程序;

        4)模擬黑客攻擊CI3,通過利用ARP 漏洞(CVE-2013-6014),使得CI3 無法與其他設(shè)備正常通信;

        5)模擬黑客攻擊CI4,同樣利用ARP 漏洞使得CI3 無法與其他設(shè)備正常通信。

        基于Q-learning 算法搜索CBTC 系統(tǒng)中最優(yōu)攻擊路徑時,該文應(yīng)用改進的策略,與原ε-greedy 進行對比,分析可知改進后的搜索策略能夠較快地訓(xùn)練得到最優(yōu)攻擊路徑,如圖3 所示。

        圖3 攻擊策略的訓(xùn)練

        4 結(jié)論

        該文主要研究了典型的CBTC 系統(tǒng)信息安全風(fēng)險,主要創(chuàng)新點包括:

        1)構(gòu)建了CBTC 系統(tǒng)的復(fù)雜網(wǎng)絡(luò)模型,分析了網(wǎng)絡(luò)模型的連通性能與列車運營等級之間的相關(guān)關(guān)系;

        2)基于強化學(xué)習(xí)模擬黑客攻擊,并應(yīng)用Q-learning算法分析得到最優(yōu)攻擊路徑,從而確定CBTC 系統(tǒng)中最嚴峻的安全風(fēng)險。

        猜你喜歡
        模型系統(tǒng)
        一半模型
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        基于PowerPC+FPGA顯示系統(tǒng)
        半沸制皂系統(tǒng)(下)
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        3D打印中的模型分割與打包
        91av精品视频| 色综合久久网| 男女啪动最猛动态图| 成全视频高清免费| 丰满人妻一区二区乱码中文电影网| 五月婷婷丁香视频在线观看| 大陆国产乱人伦| 98久9在线 | 免费| 精品免费一区二区三区在| 亚洲女同精品一区二区久久| 亚洲国产精品无码久久一区二区| 免费无码黄动漫在线观看| 久久久综合九色合综国产| 一区二区三区黄色一级片| 亚洲综合另类小说色区| 男人扒开女人下面狂躁小视频| 天天干夜夜躁| 国产精品毛片一区二区三区| 亚洲av综合av国产av中文| 无码人妻一区二区三区免费| 国产精品国产三级国产三不| 精品女厕偷拍视频一区二区| 麻豆tv入口在线看| 99热精品成人免费观看| 中文字幕二区三区在线| 久久精品中文少妇内射| 性生交大片免费看淑女出招 | 亚洲国产精品久久久久婷婷软件| 国产乱子伦一区二区三区国色天香 | 国产美女高潮流白浆免费视频| 无套内射无矿码免费看黄| 精品99在线黑丝袜| 亚洲无人区一码二码国产内射| 2018天天躁夜夜躁狠狠躁| 久久精品国内一区二区三区| 亚洲精品国产福利在线观看| 国产一区二区三区在线男友| 久久99精品九九九久久婷婷| 激情久久无码天堂| 亚洲精品中文字幕一二| 情人伊人久久综合亚洲|