皮爾達偉斯·巴吐爾,劉 捷,2*
(1.西南交通大學(xué)計算機與人工智能學(xué)院,成都 611756;2.可持續(xù)城市交通智能化教育部工程研究中心,成都 611756)
網(wǎng)絡(luò)信息內(nèi)容治理已成為國家戰(zhàn)略的重要部分,“網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定”明確了網(wǎng)絡(luò)信息內(nèi)容治理在治理目標、主體、客體、過程、工具5 個方面的核心要義[1]。近年來,在國鐵企業(yè)信息化治理過程中,借助人工智能的AI+內(nèi)容安全技術(shù)能夠高效發(fā)現(xiàn)問題,但在發(fā)現(xiàn)違規(guī)和風(fēng)險問題之后,如何及時識別事件類別、判斷風(fēng)險級別、定位響應(yīng)部門、決策應(yīng)急預(yù)案仍然缺乏研究。劉鐵民[2]指出突發(fā)事件情景構(gòu)建是當前公共安全領(lǐng)域最前沿科學(xué)問題之一,采用“情景-應(yīng)對”的理論與方法,是國內(nèi)外公共安全領(lǐng)域近年來提出的一種行之有效的科學(xué)手段。本文基于“情景-應(yīng)對”模型和知識圖譜,提出了一種面向鐵路領(lǐng)域在線客服內(nèi)容違規(guī)和風(fēng)險的應(yīng)急管理系統(tǒng)和方法。
朱世強等[3]指出知識圖譜等技術(shù)的發(fā)展,能夠加速將內(nèi)容安全治理向自動化、智能化、高效化、精準化方向推進,并建議建立健全合法有效的監(jiān)管機制和人工智能內(nèi)容安全標準體系。王建亞等[4]對網(wǎng)絡(luò)信息內(nèi)容安全風(fēng)險進行研判和特征分析,將網(wǎng)絡(luò)信息內(nèi)容安全分為9類,分析了每種風(fēng)險的內(nèi)涵和表現(xiàn),并對各類型風(fēng)險進行了場景化解構(gòu)。白文琳等[1]按照戴明環(huán)PDCA 循環(huán)思路,同時將治理目標、主體、客體、過程、工具等政策要素全部納入,設(shè)計了“PDCA-五維要素”治理行動邏輯。范維澄等[5]提出了公共安全體系的三角形模型,突發(fā)事件及其應(yīng)對中存在三個主體:突發(fā)事件、承災(zāi)載體、應(yīng)急管理。張輝等[6]在面向國家應(yīng)急平臺體系的基礎(chǔ)科學(xué)問題和集成平臺研究中突出了“情景-應(yīng)對”型決策的重要性。郭世剛等[7]研究了突發(fā)事件應(yīng)急決策方法等演變,將現(xiàn)有決策模型分為經(jīng)驗直覺法、“預(yù)測-應(yīng)對”模型、“情景-應(yīng)對”模式三類。仲秋雁等[8]基于知識元構(gòu)建了非常規(guī)突發(fā)事件情景模型。王寧等[9]提出了一種基于應(yīng)急案例的情景決策支持方法。吳艷華等[10?11]研究了“情景-應(yīng)對”模型在鐵路領(lǐng)域的應(yīng)用。
在本文創(chuàng)建鐵路領(lǐng)域在線客服違規(guī)和風(fēng)險管理知識圖譜過程中,在客服平臺和相關(guān)網(wǎng)站和公眾號采集近年來在客服違規(guī)方面發(fā)生過的案例,再通過網(wǎng)上檢索到的案例對各個實體的屬性進行保存,通過整合來構(gòu)建鐵路在線客服違規(guī)的事件庫。本文創(chuàng)建的情景模型如圖1所示。
圖1 情景模型
其中,事件(Event)實體是用來存儲所有事件的實體,在識別出鐵路在線客服內(nèi)容違規(guī)和風(fēng)險后,都存儲在這里,是整個情景模型的主體。用此實體來創(chuàng)建情景表的主體,通過各種屬性來充實事件實體的各個知識內(nèi)容,此實體的實體父類為情景,與形式為不相交的類,并且沒有添加其他的公理等描述。事件的實例是整個事件的承載者。
將鐵路客服過程中產(chǎn)生的事件實例采集到Protégé 中,如圖2 所示。通過對事件的屬性:事件id、事件類型名稱、事件發(fā)生原因、對象、事件發(fā)生時間來對應(yīng)一個唯一的事件,如圖3所示。
圖2 Protégé中的事件實例
圖3 Protégé中事件的對象屬性和數(shù)據(jù)屬性示例
形式(Form)實體是鐵路在線客服違規(guī)的形式,鐵路客服違規(guī)通常有多個形式,比如一個事件是文章中所采用的圖片是其他公司所注冊的,此事件的形式就被定義為圖片侵權(quán)。事件和形式實體是構(gòu)建情景表的主體成分,形式實體與事件實體同屬于情景實體父類。此實體的不相交實體為事件。此實體包含的實例包括公眾號文章錯誤,公告消息違規(guī)等形式的實例,這些實例構(gòu)成了事件的形式的集合,將具有相同形式性質(zhì)的事件打包成一個形式,方便應(yīng)對措施采取的統(tǒng)一性。
在應(yīng)急事件發(fā)生的過程中,將事件中的相似類型抽象歸納于一起,形成客服違規(guī)事件對應(yīng)的形式,例如,圖片侵權(quán)相關(guān)、公告消息違規(guī)、隱私信息采集告知、公眾號文章錯誤、外部網(wǎng)站發(fā)布、客服無法聯(lián)系、投訴無門、無法線上退票、字體侵權(quán)、客服態(tài)度惡劣、非實名購票、app崩潰、客服誤導(dǎo)乘客等。在Protégé中創(chuàng)建形式的實例如圖4所示,圖5展現(xiàn)了主要的數(shù)據(jù)屬性(形式id、形式名稱)和對象屬性(形式_措施、形式_風(fēng)險識別)。
圖4 Protégé中的形式實例
圖5 Protégé中形式的對象屬性和數(shù)據(jù)屬性示例
將唯一的事件id 和形式id 以事件_形式的關(guān)系形成聯(lián)系,將事件歸合為一個形式,通過形式再來確定所應(yīng)該采取的應(yīng)急解決方案。
風(fēng)險識別(Risk Identification)實體是鐵路在線客服違規(guī)后,通過識別風(fēng)險的等級來確定事件所帶來的影響,根據(jù)影響的程度來劃分事件的風(fēng)險優(yōu)先級,再根據(jù)事件的優(yōu)先級來確定事件的處理順序。此方法能夠讓事件處理更加有序,通過風(fēng)險識別來大大縮小事件的影響程度。風(fēng)險識別的屬性包含:風(fēng)險類別名稱、風(fēng)險類別id、優(yōu)先級、響應(yīng)速度、影響程度,如圖6所示。風(fēng)險識別實體是應(yīng)對計劃中的重要一環(huán),確定事件的等級,其父類為情景,與事件、形式實體為不相交的類。沒有添加其他的公理等內(nèi)容。此實體包含的實例包括了風(fēng)險級別1、風(fēng)險級別2、風(fēng)險級別3。這些實例中保存了事件的解決順序和帶來影響的數(shù)據(jù)信息,對事件出現(xiàn)時,能快速、準確、有序地解決事件起到關(guān)鍵作用。
圖6 Protégé中風(fēng)險識別實例的數(shù)據(jù)屬性示例
在鐵路領(lǐng)域客服違規(guī)事件發(fā)生的初期,能充分地掌握事件(E)、形式(F)、風(fēng)險識別(R)等信息,一個事件(E1)通過各個屬性來判斷事件形式(F1),通過事件的事件id(E1)屬性對應(yīng)一個事件的形式id(F1),以記為(E1?F1)的事件_形式關(guān)系來表示具體事件E1的對應(yīng)形式F1。
通過得到的事件所屬形式,來確定事件所歸屬的形式,進而確定一個形式所對應(yīng)的風(fēng)險識別中的風(fēng)險等級,通過確定的形式id(F1)對應(yīng)風(fēng)險類別id(R1),從而從關(guān)系形式_風(fēng)險識別來對應(yīng),記為(F1?R1)。通過事件、形式、風(fēng)險識別的對應(yīng)關(guān)系可得知事件的明確信息為(E1?F1?R1),某事件的詳細情景通過這些關(guān)系構(gòu)建出來。
事件的事件集合表示為(事件、形式、風(fēng)險識別),也可以將事件集對應(yīng)事件的情景集合,再通過各個實體的數(shù)據(jù)屬性來使知識的表示更加詳細。將事件的應(yīng)對策略創(chuàng)建為事件的應(yīng)對集,即為(措施、方案),并以這些應(yīng)對策略中的數(shù)據(jù)屬性將措施的具體行使方式和措施完成后對后續(xù)存在的問題進行精化的解決方式。本文創(chuàng)建的應(yīng)對模型如圖7所示。
措施(Measure)是與事件、形式、風(fēng)險識別所構(gòu)成的情景相對應(yīng)的應(yīng)對過程的主體內(nèi)容,措施擁有措施名稱、措施id、部門等數(shù)據(jù)屬性。能夠明確采取措施的響應(yīng)部門,確定了措施在行使的過程是由什么部門來進行,使得分工明確且能夠通過對事件的處理來評定部門的績效。此實體包含的實例包括了取消票的效益并要求乘客實名購票、告知隱私信息采集風(fēng)險等實例,這些實例集合成了事件應(yīng)對集的快速響應(yīng)的解決措施,是直接解決事件的第一步的手段集合。
圖8 Protégé中措施的對象屬性和數(shù)據(jù)屬性示例
確定事件的具體情景模型的詳細信息后,對情景模型創(chuàng)建應(yīng)對的模型,通過形式與措施的關(guān)系屬性形式_措施來確定事件的應(yīng)對策略,從措施的數(shù)據(jù)屬性措施id來確定形式(F1)的對應(yīng)的措施(M1),將形式和措施形成的關(guān)系形式_措施關(guān)系記為(F1?M1),以此關(guān)系來確定形式為F1的事件所應(yīng)采取的措施為M1,反向的推理可以推理出事件的完整關(guān)系,事件E1 的形式為F1.形式名稱,此形式風(fēng)險等級為R1.風(fēng)險類別名稱,所應(yīng)采取的措施為M1.措施名稱的應(yīng)對策略。針對每一個不同事件、形式、風(fēng)險識別的過程有不同的應(yīng)對策略進行匹配。
方案(Scheme)是指對事件措施的后續(xù)補充,方案包括:方案名稱、方案id、方案內(nèi)容、完成速度,如圖9 所示。方案內(nèi)容是對事件采取的措施的后續(xù)補充,措施完成后,對后續(xù)相關(guān)的部門進行補救,完整地將事件完成,對后續(xù)的影響進一步進行完整的措施;方案中的完成速度是指方案在實行的過程中應(yīng)該采取的執(zhí)行速度,執(zhí)行的速度應(yīng)不低于方案中規(guī)定完成速度。此實體包含的實例包括外部網(wǎng)站發(fā)文方案、客服違規(guī)方案等一系列方案的實例,這些實例可以用來做措施完成后的后續(xù)安排,讓事件的影響逐步消除,直到影響完全消除為止。
圖9 Protégé中的方案實例
在情景-應(yīng)對模型構(gòu)建基礎(chǔ)完成后,對措施進行進一步的擴張,因為單純的措施無法完成對事件的后續(xù)處置的完善,通過擴展的方案可以完善對事件措施的支援,然后通過措施和方案的關(guān)系,將措施M1 和方案S1 聯(lián)系起來,將兩者之間的聯(lián)系記為M1?S1。所以事件的整體聯(lián)系為E1?F1?R1和F1?M1?S1。
通過對事件、形式、風(fēng)險識別、措施和方案的詳細分析,充分明確了事件的形式和風(fēng)險級別,通過這些明確的信息來確定采取措施,和措施完成后的后續(xù)方案的響應(yīng)主體。這為進一步深入分析事件的應(yīng)急事件處理打下了基礎(chǔ)。
本文的主題是鐵路客服違規(guī)和風(fēng)險管理知識圖譜,而且要運用到情景應(yīng)對模型,所以在此基礎(chǔ)上創(chuàng)建知識圖譜的實體,需根據(jù)知識圖譜一般構(gòu)建方法,先構(gòu)建并識別出鐵路風(fēng)險管理知識圖譜中的實體,再確定各個實體之間的聯(lián)系,定義實體之間的屬性,然后根據(jù)實體之間的聯(lián)系再進行鐵路領(lǐng)域知識圖譜數(shù)據(jù)的抽取、融合和存儲。
本文構(gòu)建鐵路領(lǐng)域在線客服和風(fēng)險管理知識圖譜采用了Protégé 軟件來進行設(shè)計,知識來自于鐵路在線客服平臺的案例抽取,抽取案例的平臺如圖10所示。
圖10 案例平臺示例
本文創(chuàng)建的鐵路領(lǐng)域在線客服違規(guī)內(nèi)容和風(fēng)險管理知識圖譜中一個完整的關(guān)系實例如圖11所示。
圖11 知識圖譜中完整的實例
Protégé 還提供了圖顯示的功能,此功能可將Protégé 所構(gòu)建的知識圖譜本體所有的內(nèi)容通過圖的形式顯示出來,如圖12所示。
圖12 知識圖譜可視化
將Protégé 里所創(chuàng)建的鐵路領(lǐng)域客服違規(guī)與應(yīng)急風(fēng)險管理的知識圖譜本體存儲到Neo4j,就要用到Neo4j 的擴展性包neosemantics。在經(jīng)過Neo4j 內(nèi)置操作語句的修改后,將其顯示為最后的實體名稱。導(dǎo)入結(jié)果如圖13所示。
圖13 Neo4j圖數(shù)據(jù)展示內(nèi)容
Neo4j 中采用了基于路徑的圖索引,基于這種索引所創(chuàng)建的GraphGrep 是一種典型的圖索引。例如:match(n:‘ns0__事件’)return n。此語句可以輸出所有事件的實例,如圖14所示。
圖14 事件查詢
在圖數(shù)據(jù)庫中還可以利用復(fù)雜語句,通過各個實例間所形成的關(guān)系來對擁有關(guān)系的數(shù)據(jù)進行查詢,如圖15所示。
圖15 查詢示例
match data=(n:‘ns0__事件’{‘ns0__事件類型名稱’:‘a(chǎn)pp 異常’})-[r:‘ns0__事件_形式’]-(m:‘ns0__形式’)return data。所表示的實際含義為事件類別名稱為app異常的事件所屬的形式是哪個,從圖中可看出事件app 異常的形式為app崩潰的形式。
為驗證本文所提出的基于案例的應(yīng)急事件處理辦法,對事件客服平臺圖片侵權(quán)的案例進行情景-應(yīng)對模型的驗證。首先是此事件集(事件id:1,形式id:1,風(fēng)險類型id:1),應(yīng)對集(形式id:1,措施id:1,方案id:1)。此事件的基本表述為E(客服平臺圖片侵權(quán)),事件所對應(yīng)的形式為F(形式名稱:圖片侵權(quán)相關(guān)),此類形式F所對應(yīng)的風(fēng)險識別R1(風(fēng)險類別名稱:風(fēng)險等級1),R1 的優(yōu)先集為低,影響程度為有損信譽,應(yīng)該盡快解決,所采取的措施M(措施名稱:撤回信息),措施M所對應(yīng)的方案為S(方案名稱:侵權(quán)方案),此方案所采取的方式為對侵權(quán)的圖片、字體等進行整改,對侵權(quán)的機構(gòu)進行道歉,此方案要求的完成速度為不多于1天。
國鐵企業(yè)信息化治理過程中,如何借助知識圖譜等人工智能技術(shù)將內(nèi)容安全治理向自動化、智能化、高效化、精準化方向推進,具有重要的意義。本文結(jié)合知識圖譜和“情景-應(yīng)對”模型,提出了一種面向鐵路領(lǐng)域在線客服內(nèi)容違規(guī)和風(fēng)險的應(yīng)急管理方法。并采用Protégé和Neo4j進行了知識抽取、知識存儲、和知識應(yīng)用。并最終以客服平臺圖片侵權(quán)的案例對該方法進行了驗證,該方法能夠較好地輔助鐵路領(lǐng)域在線客服內(nèi)容違規(guī)和風(fēng)險的應(yīng)急管理。