亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于NLP技術(shù)的智能化監(jiān)管規(guī)則體系構(gòu)建研究

        2021-11-05 08:03:52曾宣
        電子技術(shù)與軟件工程 2021年17期
        關(guān)鍵詞:語句層級公式

        曾宣

        (云南電網(wǎng)有限責(zé)任公司信息中心 云南省昆明市 650000)

        對于監(jiān)管規(guī)則的準(zhǔn)確理解,能夠在一定程度上提高監(jiān)管質(zhì)量和監(jiān)管效率。但目前,由于監(jiān)管規(guī)則制定沒有嚴(yán)格的標(biāo)準(zhǔn)機(jī)制,因此常常會(huì)出現(xiàn)監(jiān)管規(guī)則的內(nèi)涵和外延不夠精確的問題產(chǎn)生,對于不同監(jiān)管機(jī)構(gòu)而言,可能由于錯(cuò)誤解讀造成更嚴(yán)重的管理問題產(chǎn)生[1]。同時(shí),現(xiàn)有監(jiān)管規(guī)則,缺少了對各個(gè)模塊內(nèi)容的體系化整合,因此也在一定程度上提高了監(jiān)管合規(guī)的成本。NLP技術(shù)是一種全新的自然語言處理技術(shù),將NLP技術(shù)應(yīng)用于實(shí)際可以通過機(jī)器學(xué)習(xí)的方式,針對各類復(fù)雜法律、法規(guī)等內(nèi)容進(jìn)行匯總、分析和處理,是一種十分有效的體系構(gòu)建方法,不僅可以提高規(guī)則體系在內(nèi)容理解上的一致度,還能夠進(jìn)一步降低各個(gè)機(jī)構(gòu)體系構(gòu)建的合規(guī)成本。但目前NLP技術(shù)在監(jiān)管領(lǐng)域當(dāng)中的應(yīng)用較少,為了實(shí)現(xiàn)監(jiān)管的智能化,本文引入NLP技術(shù),針對監(jiān)管領(lǐng)域當(dāng)中的規(guī)則體系構(gòu)建進(jìn)行優(yōu)化,并進(jìn)一步實(shí)現(xiàn)智能化監(jiān)管規(guī)則體系構(gòu)建。

        1 智能化監(jiān)管規(guī)則體系構(gòu)建

        1.1 基于NLP技術(shù)的監(jiān)管規(guī)則關(guān)鍵詞提取

        由于采用傳統(tǒng)監(jiān)管規(guī)則關(guān)鍵詞提取方法在實(shí)際應(yīng)用中過程復(fù)雜,并且消耗巨大,因此本文引入NLP技術(shù),利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)對監(jiān)管規(guī)則關(guān)鍵詞及相關(guān)屬性的智能化提取。由于當(dāng)前各類監(jiān)管描述文件的語言均為機(jī)器學(xué)習(xí)無法識別的自然語言,因此在獲取監(jiān)管規(guī)則關(guān)鍵詞的過程中,借助NLP技術(shù)實(shí)現(xiàn)[2]。通過NLP技術(shù)的自動(dòng)檢索過程,將負(fù)責(zé)且沒有規(guī)律的監(jiān)管文件中的自然語言轉(zhuǎn)換為計(jì)算機(jī)能夠識別的句子,通過NLP技術(shù)對句子進(jìn)行處理,并生成相應(yīng)的規(guī)則集,得到計(jì)算機(jī)能夠識別的監(jiān)管規(guī)則關(guān)鍵詞。大部分監(jiān)管規(guī)則都是以自然語言描述,其結(jié)構(gòu)當(dāng)中包含了SEQUENCE 屬性結(jié)構(gòu)、屬性類別以及屬性值。無論監(jiān)管規(guī)則關(guān)鍵詞是自然語言結(jié)構(gòu),還是ASN.1 結(jié)構(gòu),其規(guī)則的格式都需要通過RFC2119 定義。

        針對監(jiān)管規(guī)則文件的描述,若一個(gè)語句當(dāng)中包含的第一個(gè)小節(jié)描述的關(guān)鍵詞,則將其稱之為一個(gè)規(guī)則。圖1 為基于NLP技術(shù)的監(jiān)管規(guī)則關(guān)鍵詞提取流程示意圖。

        在提取過程中,首先需要對數(shù)據(jù)進(jìn)行格式化處理,并針對各個(gè)監(jiān)管文件當(dāng)中的頁眉和頁腳進(jìn)行處理,并去除掉其中無效字符,例如空格,多余*等,只保留其語句部分。其次,再針對提取到的純文本進(jìn)行斷句,并將其按照一定規(guī)律劃分為一段一段字符串,由NLP技術(shù)對其進(jìn)行識別[3]。在這一過程中,對包含提取到的關(guān)鍵詞段落進(jìn)行搜索,并將其存儲在自然語言規(guī)則集當(dāng)中,完成對監(jiān)管規(guī)則關(guān)鍵詞的提取。

        1.2 智能化監(jiān)管描述語句詞性標(biāo)記

        完成對監(jiān)管規(guī)則關(guān)鍵詞的提取后,每一個(gè)詞都有相對應(yīng)的自然語言屬性,針對名詞詞性的標(biāo)記,可直接采用NLP 當(dāng)中的自然語言處理包完成,并通過隱式馬爾科夫算法實(shí)現(xiàn)。標(biāo)記的過程可以稱之為馬爾科夫過程,可用如下公式表示:

        公式(1)中,P 表示為名詞詞性標(biāo)記概率;S 表示為標(biāo)記過程中的一個(gè)時(shí)間狀態(tài);Sn表示為在某一時(shí)刻n 時(shí)的狀態(tài)。通過公式(1)可以看出,若Sn+1對于過去狀態(tài)的條件概率分布僅表示為Sn的一個(gè)函數(shù),則當(dāng)前時(shí)刻的狀態(tài)與上一狀態(tài)相關(guān),反之同理。按照上述公式完成對名詞詞性的關(guān)鍵詞標(biāo)記,但在一個(gè)完整的監(jiān)管規(guī)則文件當(dāng)中不僅包含了名詞詞性還有助詞和動(dòng)詞[4]。表1 為大量監(jiān)管規(guī)則描述語句當(dāng)中的狀態(tài)遷移矩陣。

        從表1 中得出的狀態(tài)遷移矩陣可以看出,在名詞后接上述三個(gè)詞性的概率分別為0.2/0.3/0.5。因此在對一個(gè)監(jiān)管描述語句進(jìn)行任務(wù)標(biāo)記時(shí),若前一個(gè)為名詞,則后一個(gè)詞最大概率為動(dòng)詞[5]。根據(jù)詞性,對監(jiān)管描述語句進(jìn)行二元組表達(dá),并通過組合元組信息生成條件從句信息,完成對監(jiān)管描述語句詞性的標(biāo)記。通過上述標(biāo)記方式實(shí)現(xiàn)對監(jiān)管描述語句的結(jié)構(gòu)化定義,將監(jiān)管規(guī)則關(guān)鍵詞作為NLP技術(shù)可識別的特征量,并生成最終的特征規(guī)則,實(shí)現(xiàn)對監(jiān)管描述文件的標(biāo)記和對信息任務(wù)的提取。

        表1:大量監(jiān)管規(guī)則描述語句當(dāng)中的狀態(tài)遷移矩陣

        1.3 基于End-to-End模型的監(jiān)管規(guī)則體系內(nèi)容表達(dá)

        為進(jìn)一步實(shí)現(xiàn)監(jiān)管規(guī)則體系構(gòu)建的智能化,引入End-to-End 模型,定義一個(gè)由單序列三元組的數(shù)據(jù)結(jié)構(gòu)。將監(jiān)管規(guī)則體系結(jié)構(gòu)劃分為Bi-LSTM 層(層級I)、Dropout 層(層級II)和LSTM 解碼層(層級III)。分別針對其各個(gè)層次進(jìn)行對監(jiān)管規(guī)則體系內(nèi)容的表達(dá),首先針對層級I 而言,在監(jiān)管規(guī)則進(jìn)入到這一層級當(dāng)中時(shí),將輸入的關(guān)鍵詞放入到詞嵌入層當(dāng)中,構(gòu)成一個(gè)嵌入矢量,其表達(dá)式為:

        公式(2)中,W 表示為所有單詞序列的集合;wt表示為關(guān)鍵詞嵌入矢量;n 表示為當(dāng)前監(jiān)管規(guī)則語句的長度;d 表示為維度。在完成嵌入處理后,層級I 輸入門當(dāng)中的內(nèi)容可用公式(3)表達(dá):

        公式(3)中,it表示為層級I 輸入門當(dāng)中的內(nèi)容;δ 表示為監(jiān)管規(guī)則語句信息附加權(quán)重;bi表示為監(jiān)管規(guī)則語句狀態(tài)數(shù)據(jù),若使用,則bi值趨近于1,若不使用,則bi值趨近于0。其次,針對層級II,假設(shè)每一個(gè)隱藏單元都是相互不可依賴的,則需要利用Dropout 解決每個(gè)協(xié)同適應(yīng)隱藏層,其表達(dá)式為:

        公式(4)中,p(i)表示為某一監(jiān)管規(guī)則關(guān)鍵詞i 的隱藏激活概率。最后,在層級III 當(dāng)中完成對監(jiān)管規(guī)則的解碼,實(shí)現(xiàn)對監(jiān)管規(guī)則體系內(nèi)容的精確表達(dá)。利用如下公式(5)對層級II 當(dāng)中的監(jiān)管規(guī)則體系隱藏單元進(jìn)行處理:

        公式(5)中,yt表示為監(jiān)管規(guī)則體系內(nèi)容最終表達(dá)結(jié)果;Wy表示為softmax 矩陣;Tt表示為上述標(biāo)記的種類個(gè)數(shù);by表示為隱藏層中監(jiān)管規(guī)則語句狀態(tài)數(shù)據(jù)。根據(jù)上述表達(dá)式,在層級III 當(dāng)中完成處理后,得到各個(gè)監(jiān)管規(guī)則所述標(biāo)記實(shí)體的可能性,實(shí)現(xiàn)標(biāo)記替代,完成對監(jiān)管規(guī)則體系內(nèi)容的表達(dá)。

        2 實(shí)驗(yàn)論證分析

        為了驗(yàn)證本文提出的智能化監(jiān)管規(guī)則體系構(gòu)建方法在實(shí)際應(yīng)用中是否能夠滿足各項(xiàng)應(yīng)用性能需要,選擇將六種當(dāng)前流行的SSL/TLS 監(jiān)管描述文件作為實(shí)驗(yàn)對象。分別利用本文提出的構(gòu)建方法和傳統(tǒng)構(gòu)建方法對六個(gè)監(jiān)管描述文件進(jìn)行規(guī)則體系構(gòu)建。為了確保實(shí)驗(yàn)的客觀性,在實(shí)驗(yàn)前,對構(gòu)件評估標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì),選擇以構(gòu)建后體系的漏洞數(shù)作為評價(jià)指標(biāo)。其計(jì)算公式為:

        公式(6)中,BPR(i)表示為某一監(jiān)管描述文件i 完成規(guī)則體系構(gòu)建后的漏洞數(shù);N 表示為存在差異解釋的證書個(gè)數(shù);RN 表示為實(shí)驗(yàn)中某一類型監(jiān)管描述文件的測試監(jiān)管規(guī)則總數(shù)。根據(jù)上述公式,對兩種構(gòu)建方法生成的監(jiān)管規(guī)則體系漏洞數(shù)計(jì)算,并將結(jié)果繪制成如表2所示。

        表2:兩種監(jiān)管規(guī)則體系構(gòu)建方法漏洞數(shù)對比表

        根據(jù)表2 兩組數(shù)據(jù)對比得出,本文構(gòu)建方法在完成對6 個(gè)文件的監(jiān)管規(guī)則體系構(gòu)建后,漏洞數(shù)均控制在10 個(gè)以下,由于文件中規(guī)則信息較多,10 個(gè)以下的漏洞數(shù)可忽略不計(jì)。傳統(tǒng)構(gòu)建方法在完成對6 個(gè)文件的監(jiān)管規(guī)則體系構(gòu)建后,漏洞數(shù)均超過10 個(gè),并且最高達(dá)到了58 個(gè),嚴(yán)重影響對監(jiān)管規(guī)則體系的理解,容易保證規(guī)則體系在內(nèi)容理解上的一致性。因此,通過對比實(shí)驗(yàn)證明,引入NLP技術(shù)后,在對監(jiān)管規(guī)則體系構(gòu)建時(shí)能夠?qū)崿F(xiàn)對內(nèi)容更容易地理解,并且利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)智能化構(gòu)建。

        3 結(jié)束語

        本文引入NLP技術(shù)對監(jiān)管規(guī)則體系進(jìn)行構(gòu)建,并實(shí)現(xiàn)了對體系內(nèi)容的準(zhǔn)確表達(dá)。但這種方法在實(shí)際應(yīng)用中仍然存在大量映射,受到人工干預(yù)的影響使得智能化程度較淺,因此在后續(xù)的研究中還將針對NLP技術(shù)在構(gòu)建方法當(dāng)中的應(yīng)用進(jìn)行更加深入研究,從而借助自然語言處理實(shí)現(xiàn)對映射問題的控制,從而實(shí)現(xiàn)該構(gòu)建方法的廣泛應(yīng)用。

        猜你喜歡
        語句層級公式
        組合數(shù)與組合數(shù)公式
        排列數(shù)與排列數(shù)公式
        軍工企業(yè)不同層級知識管理研究實(shí)踐
        等差數(shù)列前2n-1及2n項(xiàng)和公式與應(yīng)用
        基于軍事力量層級劃分的軍力對比評估
        重點(diǎn):語句銜接
        例說:二倍角公式的巧用
        精彩語句
        任務(wù)期內(nèi)多層級不完全修復(fù)件的可用度評估
        如何搞定語句銜接題
        語文知識(2014年4期)2014-02-28 21:59:52
        日本韩国三级在线观看| 久久香蕉国产线看观看网| 久热香蕉精品视频在线播放| 成人性生交c片免费看| 美丽的小蜜桃在线观看| 国模雨珍浓密毛大尺度150p| 红杏亚洲影院一区二区三区| 娇妻粗大高潮白浆| 日韩人妖干女同二区三区| 欧美老熟妇乱子| 中国丰满熟妇xxxx| 中文字幕人成人乱码亚洲| 精品女人一区二区三区| 久久精品99国产精品日本| 无码人妻精品一区二区三区下载 | 亚洲精品夜夜夜妓女网| 青草福利在线| 日本福利视频免费久久久| 国产av在线观看一区二区三区| 久久天天躁狠狠躁夜夜2020一| 中文字幕第七页| 国产女人高潮的av毛片| 国产精品会所一区二区三区| 亚洲aⅴ天堂av天堂无码麻豆| 高清国产美女一级a毛片在线| 久久开心婷婷综合中文| 色88久久久久高潮综合影院| 夜夜爽一区二区三区精品| av大片在线无码永久免费网址| 日本久久精品视频免费| 鲁一鲁一鲁一鲁一曰综合网| 高清国产日韩欧美| 日本视频一区二区三区三州| 中文字幕av伊人av无码av| 国产精品久久婷婷六月丁香| 免费无码AⅤ片在线观看| 国产在线观看视频一区二区三区| 国产真实乱对白精彩久久老熟妇女 | 久草视频在线手机免费看| 伊人久久大香线蕉综合网站| 亚洲欧洲久久久精品|