亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于語(yǔ)義理解和AI 的電力設(shè)備信息檢索方法

        2022-11-18 14:01:30余少鋒廖崇陽(yáng)
        電子設(shè)計(jì)工程 2022年22期
        關(guān)鍵詞:信息檢索電力設(shè)備語(yǔ)義

        佘 俊,羅 勇,余少鋒,廖崇陽(yáng)

        (1.南方電網(wǎng)公司調(diào)峰調(diào)頻發(fā)電有限公司信息通信分公司,廣東廣州 511442;2.南方電網(wǎng)公司調(diào)峰調(diào)頻發(fā)電有限公司西部檢修試驗(yàn)分公司,貴州興義 562400)

        在現(xiàn)代智能電力系統(tǒng)中,電力數(shù)據(jù)結(jié)構(gòu)復(fù)雜、類型多、存儲(chǔ)量大。電網(wǎng)大數(shù)據(jù)通常分為結(jié)構(gòu)化和非結(jié)構(gòu)化兩種,兩種不同結(jié)構(gòu)的大數(shù)據(jù)在電網(wǎng)中有不同的應(yīng)用價(jià)值[1]。在這種情況下,結(jié)構(gòu)化數(shù)據(jù)可用于戰(zhàn)略制定和統(tǒng)計(jì)分析預(yù)測(cè)趨勢(shì)[2]。非結(jié)構(gòu)化數(shù)據(jù)所占比例較大,因?yàn)槠浒罅坑伞爸匾獌?nèi)容經(jīng)常被記錄”所產(chǎn)生的文本數(shù)據(jù),這些大容量、高價(jià)值密度的有用信息能夠提高企業(yè)的效率和收益[3]。對(duì)于電力企業(yè)來(lái)說(shuō),如何檢索這部分?jǐn)?shù)據(jù),將對(duì)企業(yè)的戰(zhàn)略部署和發(fā)展方向產(chǎn)生重大影響。因此,實(shí)時(shí)檢索獲取電力設(shè)備運(yùn)行信息具有現(xiàn)實(shí)意義[4]。

        在電力設(shè)備中,采用基于搜索引擎的信息檢索方法,常常會(huì)存在信息超載和詞匯不匹配的現(xiàn)象,使得用戶向搜索引擎提交的查詢語(yǔ)句往往不規(guī)范,給查詢過(guò)程造成困難。雖然基于語(yǔ)義相似性計(jì)算的電力設(shè)備信息檢索方法已經(jīng)取得了很大的進(jìn)展,但是仍然沒(méi)有從根本上提高檢索性能,對(duì)詞與詞之間的語(yǔ)義關(guān)系缺乏深入研究。同時(shí),由于對(duì)語(yǔ)義關(guān)系的研究不受語(yǔ)境的限制,從而造成檢索詞的混亂。針對(duì)上述問(wèn)題,該文提出了基于語(yǔ)義理解和AI 的電力設(shè)備信息檢索新方法。

        1 信息檢索方法設(shè)計(jì)

        1.1 電力設(shè)備信息特征提取技術(shù)

        該研究通過(guò)提取文本特征剔除多余虛詞,然后借助分詞工具依次標(biāo)注電力設(shè)備信息中的分詞與詞性[5]。使用詞頻加權(quán)方法分析文檔權(quán)重,其公式為:

        式(1)中,tfik表示想要檢索的電力設(shè)備信息在檢索文檔中出現(xiàn)的次數(shù);N表示電力設(shè)備信息文檔數(shù)量;nk表示電力設(shè)備信息全部文檔中出現(xiàn)想要檢索的電力設(shè)備信息的文檔數(shù)量[6]。

        通常,詞組是構(gòu)成文檔的關(guān)鍵部分,一篇文章中最頻繁出現(xiàn)的一組詞為中心主題,通常用TF 詞頻度來(lái)衡量類似文本的特點(diǎn)[7]。文字出現(xiàn)的頻率越低,說(shuō)明文本分類識(shí)別的準(zhǔn)確率越高。因此,利用文本頻率和詞頻度的乘積可以表示特征空間的測(cè)度值,再通過(guò)調(diào)整權(quán)重的方式突出關(guān)鍵字。

        1.2 基于語(yǔ)義理解的電力設(shè)備信息處理技術(shù)

        基于語(yǔ)義理解就是發(fā)現(xiàn)詞和符號(hào)所表達(dá)的“意義”,根據(jù)這一思想,語(yǔ)義理解也需要一個(gè)以句子意義作為最終理解和表達(dá)的形式符號(hào)系統(tǒng),其描述公式為:

        式(2)中,CE表示語(yǔ)句類的表達(dá)式;S表示語(yǔ)義塊;C表示描述對(duì)象;f()和g()表示約束函數(shù)[8-10]。

        結(jié)合上述公式,設(shè)計(jì)基于語(yǔ)義理解的電力設(shè)備信息處理步驟,如圖1 所示。

        如圖1 所示,處理語(yǔ)義信息時(shí),虛線框中的句類假設(shè)和檢測(cè)、語(yǔ)義塊構(gòu)成等作為處理環(huán)節(jié),輸入自然語(yǔ)言語(yǔ)句,再輸出相應(yīng)的句類表示和詞描述[11-12]。

        具體處理步驟:在信息預(yù)處理之后,基于句子中懷疑詞所包含的概念對(duì)可能的句型作出假設(shè),并基于所包含的概念性知識(shí)來(lái)判斷句子的類型?;诖耍谜Z(yǔ)義塊來(lái)判斷詞語(yǔ),假定在處理過(guò)程中未能通過(guò)上述步驟,將導(dǎo)致追溯,此時(shí)需要再次進(jìn)行“假設(shè)”和“探測(cè)”[13]。

        1.3 查詢擴(kuò)展技術(shù)

        查詢擴(kuò)展技術(shù)是語(yǔ)義檢索的關(guān)鍵技術(shù),通過(guò)添加與原始查詢語(yǔ)言查詢語(yǔ)義相關(guān)的詞或概念,使查詢時(shí)間較原始查詢長(zhǎng),從而提高了文檔檢索效率、查全率和準(zhǔn)確性[14]。通過(guò)對(duì)相關(guān)內(nèi)容和用戶需求的比較,提取語(yǔ)義信息;對(duì)于知識(shí)庫(kù)中存在的詞組,使用語(yǔ)義詞典對(duì)語(yǔ)義進(jìn)行擴(kuò)展處理,并以表格形式展現(xiàn)給用戶,供用戶自行識(shí)別[15]。查詢字符串被擴(kuò)展成搜索引擎查詢,查詢結(jié)果被聚類并呈現(xiàn)給用戶。查詢擴(kuò)展流程如圖2 所示。

        具體查詢擴(kuò)展過(guò)程:首先應(yīng)確定原始查詢串r;然后擴(kuò)展查詢串R,經(jīng)過(guò)分詞處理后,將原始查詢串r分解成n個(gè)檢索關(guān)鍵詞[16]。其中,關(guān)鍵詞語(yǔ)義相似度最為接近的同義詞數(shù)量為m1,m2,…,mn,將其擴(kuò)展為r11,…,r1m1,r21,…r2m2,…,rn1…,rnmn詞組,并確定擴(kuò)展查詢子串為k=m1×m2×…×mn+1 個(gè);最終得到的各個(gè)查詢子串為:

        結(jié)合式(3),可得到擴(kuò)展后的查詢子串。

        1.4 基于語(yǔ)義理解的AI檢索模型構(gòu)建

        基于上述內(nèi)容,構(gòu)建基于語(yǔ)義理解的AI 檢索模型,如圖3 所示。

        由圖3 可知,該模型主要是由四個(gè)模塊組成的,如下所示:

        1)預(yù)處理模塊

        為便于后續(xù)的相似度計(jì)算,在用戶查詢之前采用分詞和刪除停用詞的預(yù)處理方式,將停用詞轉(zhuǎn)換成文件矢量形式。

        2)語(yǔ)義關(guān)系分析模塊

        通過(guò)預(yù)處理模塊搭建語(yǔ)義知識(shí)庫(kù),使不同詞語(yǔ)形成語(yǔ)法依賴關(guān)系。語(yǔ)義概念空間是一種能將語(yǔ)言進(jìn)行量化處理的空間,通過(guò)語(yǔ)義判斷能夠解決概念間隱含的數(shù)據(jù)結(jié)構(gòu)問(wèn)題。量化機(jī)制中的事態(tài)信息量級(jí)如表1 所示。

        表1 事態(tài)信息量級(jí)

        3)判別信息空間模塊

        在選擇信息空間時(shí),要根據(jù)三種不同的語(yǔ)言信息量,通過(guò)句法依賴圖進(jìn)行判斷。

        4)語(yǔ)境分析和查詢模塊

        識(shí)別出信息空間后,對(duì)文檔數(shù)據(jù)庫(kù)中的各個(gè)數(shù)據(jù)進(jìn)行匹配,使得數(shù)據(jù)可以對(duì)應(yīng)于文檔,然后對(duì)文檔進(jìn)行排序,并返回查詢結(jié)果。

        2 實(shí)驗(yàn)與分析

        為了驗(yàn)證基于語(yǔ)義理解和AI 的電力設(shè)備信息檢索方法的有效性,結(jié)合F 供電局供電情況進(jìn)行實(shí)驗(yàn)驗(yàn)證分析。

        2.1 F供電局概況

        F 供電局是某供電公司直屬的企業(yè),主要負(fù)責(zé)電力供應(yīng),目前供電客戶為300 多萬(wàn)戶,在2020 年該供電局最高供應(yīng)負(fù)荷可達(dá)到1 500 萬(wàn)千瓦。截至到目前,F(xiàn) 供電局共有110 kV、220 kV、500 kV 輸電線路長(zhǎng)4 500 km 左右,主變壓器為五百多臺(tái)。F 供電局主要電力設(shè)備如表2 所示。

        表2 F供電局主要電力設(shè)備

        2.2 電力設(shè)備信息集

        從F 供電局的變壓器、斷路器、變電站和電源開(kāi)關(guān)四種設(shè)備中提取電力設(shè)備信息,構(gòu)成信息集,信息集中保留了電力設(shè)備共600 條信息。

        2.3 實(shí)驗(yàn)指標(biāo)確定

        1)信息查全率

        設(shè)檢索出的變壓器、斷路器、變電站和電源開(kāi)關(guān)四種設(shè)備電力設(shè)備信息為a,總信息量為c,信息查全率計(jì)算公式為:

        由式(4)可知,總信息量c中除了檢索到的全部信息外,還包含歷史信息庫(kù)中的信息,信息查全率越高,說(shuō)明從全部信息中檢索到的變壓器、斷路器、變電站和電源開(kāi)關(guān)四種設(shè)備電力設(shè)備信息就越全面。

        2)信息查準(zhǔn)率

        設(shè)檢索出的變壓器、斷路器、變電站和電源開(kāi)關(guān)四種設(shè)備電力設(shè)備信息為a,其余信息量為b,由此計(jì)算信息查準(zhǔn)率:

        由式(5)可知,信息查準(zhǔn)率越高,說(shuō)明從全部信息中檢索到變壓器、斷路器、變電站和電源開(kāi)關(guān)四種設(shè)備電力設(shè)備信息的精度就越高。

        2.4 實(shí)驗(yàn)結(jié)果與分析

        2.4.1 信息查全率

        結(jié)合表2 確定檢索到的總信息數(shù)量為7 544 條,分別使用基于搜索引擎的電力設(shè)備信息檢索方法、基于語(yǔ)義相似度計(jì)算的電力設(shè)備信息檢索方法和基于語(yǔ)義理解和AI 的電力設(shè)備信息檢索方法對(duì)信息查全率進(jìn)行對(duì)比分析,結(jié)果如圖4 所示。

        由圖4 可知,使用基于搜索引擎的檢索方法在前5 次計(jì)算過(guò)程中,信息查全率大于60%,在后4 次計(jì)算過(guò)程中,信息查全率大幅度下降,說(shuō)明該計(jì)算過(guò)程受到了歷史信息庫(kù)中的信息影響;使用基于語(yǔ)義相似度計(jì)算的檢索方法在9 次計(jì)算過(guò)程中,信息查全率大于60%;使用基于語(yǔ)義理解和AI 的檢索方法在9 次計(jì)算過(guò)程中,信息查全率始終大于80%。

        2.4.2 信息查準(zhǔn)率

        對(duì)比分析不同方法的信息查詢結(jié)果,如表3所示。

        由表3可知,基于語(yǔ)義理解和AI的電力設(shè)備信息檢索方法的查準(zhǔn)率接近100%,具有精準(zhǔn)檢測(cè)結(jié)果。

        表3 不同方法信息查詢結(jié)果對(duì)比分析

        3 結(jié)束語(yǔ)

        該文提出一種基于語(yǔ)義理解和AI 的電力設(shè)備信息檢索方法,有效提高了檢索查全率和查準(zhǔn)率。

        該方法的主要特點(diǎn):相對(duì)于傳統(tǒng)檢索方法,基于語(yǔ)義理解擴(kuò)展原始的關(guān)鍵字集合,得到新的關(guān)鍵字集合。此集合更適合于用戶希望表達(dá)的內(nèi)容,因此使查詢更精確;該方法可以快速建立和優(yōu)化索引,同時(shí)利用查詢擴(kuò)展模塊對(duì)關(guān)鍵字集進(jìn)行檢索,利用索引技術(shù)實(shí)現(xiàn)快速高效的檢索。

        猜你喜歡
        信息檢索電力設(shè)備語(yǔ)義
        加強(qiáng)電力設(shè)備運(yùn)維云平臺(tái)安全性管理
        語(yǔ)言與語(yǔ)義
        電力設(shè)備運(yùn)維管理及安全運(yùn)行探析
        醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
        新聞傳播(2016年18期)2016-07-19 10:12:06
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
        基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
        認(rèn)知范疇模糊與語(yǔ)義模糊
        基于改進(jìn)Canny算子的電力設(shè)備圖像檢測(cè)研究
        教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
        河南科技(2014年11期)2014-02-27 14:10:19
        亚洲av手机在线观看| 国模私拍福利一区二区| 无码人妻精品一区二区三区下载| 中文字幕被公侵犯的丰满人妻| 国产午夜亚洲精品国产成人av| yw尤物av无码国产在线观看| 精品国产一区二区三区久久久狼 | 国产成年女人特黄特色毛片免| 日本丰满妇人成熟免费中文字幕| 加勒比特在线视频播放| 少妇被猛烈进入到喷白浆| 成人综合婷婷国产精品久久蜜臀 | 国产精选污视频在线观看| 无码日日模日日碰夜夜爽| 少妇人妻在线伊人春色| 国产成人av无码精品| 一本一道久久a久久精品综合| 国产精品青草久久久久婷婷| 国自产偷精品不卡在线| 精品久久久无码不卡| 东北老熟女被弄的嗷嗷叫高潮| …日韩人妻无码精品一专区| 人妻在卧室被老板疯狂进入国产| 久久精品国产av大片| 日韩有码在线观看视频| 女人和拘做受全程看视频| 亚洲日本三级| 久久无人码人妻一区二区三区| 亚洲免费观看视频| 51久久国产露脸精品国产| 亚洲AV秘 无码一区二区三区| 亚洲国产人成综合网站| 国产男女免费完整视频| 久久综合五月天| 国产av在线观看91| 亚洲小说区图片区色综合网| 精品国产18久久久久久| av无码特黄一级| 亚洲一区二区三区偷拍厕所 | 91福利精品老师国产自产在线| 亚洲成人一区二区三区不卡|