亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析電力數(shù)據(jù)中的知識提取算法及應(yīng)用

        2020-11-17 00:11:18郝景昌
        裝備維修技術(shù) 2020年37期
        關(guān)鍵詞:電力大數(shù)據(jù)知識圖譜

        郝景昌

        摘 ?要:隨著計算機(jī)技術(shù)及互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展,電力行業(yè)越來越多的數(shù)據(jù)進(jìn)入網(wǎng)絡(luò)。海量的數(shù)據(jù)給電力行業(yè)中的數(shù)據(jù)存儲、處理、分析帶來較大的開銷。知識圖譜、屬性約簡、智能決策等技術(shù)為電力大數(shù)據(jù)的處理提供了較好的解決方案。然而在多維度、全方位的電力大數(shù)據(jù)中,針對知識本身的提取及表示的相關(guān)研究仍有所不足。電力大數(shù)據(jù)中的知識在多個維度的歸一化、知識表達(dá)的標(biāo)準(zhǔn)化方面仍有所不足?;谠颇P捅旧淼亩ㄐ远坎淮_定性轉(zhuǎn)換能力,對多維云模型增加歸一化改進(jìn),進(jìn)而提出一種面向電力大數(shù)據(jù)的知識提取算法。

        關(guān)鍵詞:電力大數(shù)據(jù);知識圖譜;數(shù)據(jù)約簡;知識提取

        1引言

        隨著國家新電改方案的實施與推進(jìn),“互聯(lián)網(wǎng)+電力”思維逐漸開始引領(lǐng)電力企業(yè),成為一種主要的經(jīng)營思路之一。隨著電力企業(yè)市場化的推進(jìn),電力企業(yè)逐漸告別壟斷,開始走向營銷服務(wù)的時代。另一方面,隨著工業(yè)互聯(lián)網(wǎng),能源互聯(lián)網(wǎng)的發(fā)展,電力行業(yè)的各個環(huán)節(jié),從發(fā)電到電力公司的運營,均開始向信息化、自動化、智能化方向發(fā)展。

        在“互聯(lián)網(wǎng)+電力”的發(fā)展過程中,越來越多的電力數(shù)據(jù)進(jìn)入互聯(lián)網(wǎng)。這些數(shù)據(jù)涵蓋電力行業(yè)的全過程,包含多個場景、多種環(huán)節(jié)。電力行業(yè)也在逐步邁入大數(shù)據(jù)時代。

        當(dāng)前電力大數(shù)據(jù)領(lǐng)域的研究均在數(shù)據(jù)的處理與分析基礎(chǔ)上進(jìn)行。其中,電力知識的構(gòu)建是其核心過程。然而,當(dāng)前研究中,對于電力知識的構(gòu)建過程仍有進(jìn)一步提升的空間。在多維數(shù)據(jù)的處理中,如何有效挖掘不同維度數(shù)據(jù)中的信息,如何能夠既避免噪聲的干擾,又不忽略實際具有價值的信息,是當(dāng)前知識構(gòu)建中的主要難題。

        本文圍繞電力大數(shù)據(jù)中的知識構(gòu)建展開研究,在云模型的基礎(chǔ)上,提出了一種改進(jìn)的多維云模型。該模型能夠?qū)Χ嗑S屬性進(jìn)行歸一化處理,處理后構(gòu)建多維云。在改進(jìn)的多維云模型基礎(chǔ)上,本文提出一種電力大數(shù)據(jù)中的知識提取算法,該算法能夠有效提取核心屬性信息,并基于核心屬性信息,構(gòu)建知識的抽象表示。所提取的知識還具備重構(gòu)數(shù)據(jù)的能力。仿真實驗表明了本文所提出的算法在數(shù)據(jù)重構(gòu)以及知識準(zhǔn)確提取方面均具有較強(qiáng)的性能。

        2改進(jìn)的多維云模型

        2.1多維空間知識

        物理世界中的現(xiàn)象映射至互聯(lián)網(wǎng)空間時,數(shù)據(jù)往往包括多種維度的屬性。此時的知識包含多個維度下,數(shù)值接近的數(shù)據(jù)點。數(shù)據(jù)點的集合形成多維空間知識?,F(xiàn)給出多維空間知識的定義及表示方法。

        定義1 多維空間知識. 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上一類數(shù)據(jù)的集合,使用給定值 ,將X在論域上的分布稱為多維空間知識,記作K(X),每個X稱為知識的一次實現(xiàn),其表示為N維空間中的一個數(shù)據(jù)點: 。

        多維空間中的知識提取,是將觀察到的知識的若干次實現(xiàn)提取為知識的抽象表示的過程。為此,我們引入改進(jìn)的多維云模型。

        2.1改進(jìn)的多維云模型

        李德毅院士在基于概論率、模糊數(shù)學(xué)的基礎(chǔ)上提出了云模型的概念,實現(xiàn)了包含不確定性的語言概念值與定量數(shù)值之間的相互轉(zhuǎn)換。云模型的數(shù)據(jù)特征用期望Ex ,熵En 和超熵He來表示,它們反映概念整體的定性特征。云模型既可以表示一維空間中的概念,也可以表示多維空間中的概念。當(dāng)使用云模型表示多維空間中的概念時,三個特征值均為多維數(shù)據(jù)。然而,由于多維空間中的數(shù)據(jù)尺度變化較大,缺乏統(tǒng)一的度量,本文云模型基礎(chǔ)上引出了多維屬性的歸一化策略,提出一種改進(jìn)的多維云模型,用以表示多維空間中的知識。

        定義2 多維空間云模型. 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上的知識,其中包含M次實現(xiàn)。多維空間云模型MC用以對K進(jìn)行抽象表示,包含兩部分信息:核與多維尺度因子。其數(shù)學(xué)表示如下: ?。其中, 表示核,是N維云的中心點, ;A表示云在N個維度下的不確定性, ;I表示多維尺度因子,為一個N維向量 。

        在多維空間云模型中,核 是云的中心點,是最能代表知識的點,也是知識最典型的實現(xiàn),也可以表示知識的內(nèi)涵。不確定性A由知識的隨機(jī)性和模糊性共同決定,是多維屬性歸一化后的結(jié)果,表示與知識的內(nèi)涵、外延無關(guān)的,蘊(yùn)含在知識中的不確定性。多維尺度因子I表示知識在多個屬性下的標(biāo)尺,是多維屬性歸一化后提取出的結(jié)果,也可以用來表示知識在多個維度下的外延。

        2.2多維屬性的歸一化方法

        在知識的多維屬性中,不同維度的數(shù)值具有各自不同的量綱,不同維度下數(shù)值的分布會出現(xiàn)分布不均衡的現(xiàn)象。在提取知識時,分布范圍較窄的屬性往往會被忽略,這將造成知識提取的不準(zhǔn)確。為此,本文提出一種多維屬性的歸一化方法。

        多維屬性的歸一化主要目標(biāo)是將多個維度的屬性數(shù)值進(jìn)行處理,使各個維度的云模型表示中熵值均等于1。此時各維度下所去除的標(biāo)尺即為多維尺度因子,此時的超熵值即為不確定度。使用K表示N維空間上的某一知識: 。其中, ,多維屬性的歸一化可以從數(shù)據(jù)中提取抽象特征,得到多維空間的云模型。

        相比原始的逆向云模型算法,增加了歸一化處理的改進(jìn)的多維云模型能夠去除不同維度下屬性尺度的影響。在知識發(fā)現(xiàn)中,能夠有效防止忽略變化范圍小的數(shù)據(jù)。當(dāng)數(shù)據(jù)在多個維度分布時,增加歸一化處理之后,一方面可以使多個維度下的尺度統(tǒng)一,另一方面在數(shù)據(jù)特征提取及數(shù)據(jù)生成時,由于各個維度數(shù)據(jù)統(tǒng)一,可以通過特征的提取與疊加實現(xiàn)多維度下數(shù)據(jù)的統(tǒng)一快速處理。

        3面向電力大數(shù)據(jù)的知識提取算法

        在電力大數(shù)據(jù)中,數(shù)據(jù)涵蓋的范圍非常廣泛,主要包括電力行業(yè)基本信息數(shù)據(jù)、電力標(biāo)準(zhǔn)數(shù)據(jù)、電力基礎(chǔ)設(shè)施數(shù)據(jù)、電力業(yè)務(wù)數(shù)據(jù)、用電行為數(shù)據(jù)、運維行為數(shù)據(jù)、商業(yè)運營數(shù)據(jù)等等。其中任何一個領(lǐng)域中的數(shù)據(jù)又包含多種維度,這些維度可能存在交叉,也可能具有高度的相關(guān)性。因此,在面對特定范圍內(nèi)電力數(shù)據(jù)的知識提取中,首先需要對多維數(shù)據(jù)進(jìn)行分析,去除噪聲,尋找屬性的相關(guān)性,獲取其核心屬性,進(jìn)而在核心屬性的基礎(chǔ)上,提取知識。

        3.1電力大數(shù)據(jù)的核心屬性發(fā)現(xiàn)算法

        針對某一范圍的電力數(shù)據(jù),其中往往含有多種屬性,在這些屬性中,有三類屬性在知識發(fā)現(xiàn)中無需參與運算,本文定義為“非核心屬性”。非核心屬性主要包含如下三類:

        (1)非數(shù)值型屬性。某些屬性的數(shù)據(jù)不具備數(shù)值特性,例如用戶ID,用戶手機(jī)號等。這些數(shù)據(jù)沒有數(shù)學(xué)意義,無法參與數(shù)學(xué)運算,屬于離散的非數(shù)字屬性。這些屬性在知識發(fā)現(xiàn)中無法參與運算,因而需要首先進(jìn)行排除。

        (2)噪聲屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特定,然而這些數(shù)值始終相同或極為接近,基本不會發(fā)生變化,這些數(shù)據(jù)在知識發(fā)現(xiàn)中將沖淡核心屬性的價值,屬于噪聲數(shù)據(jù),也應(yīng)在知識發(fā)現(xiàn)中進(jìn)行排除。

        (3)從屬屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特性也會變化,然而其變化受某種核心屬性的影響,隨某種核心屬性的變化而變化。這類數(shù)據(jù)稱之為核心數(shù)據(jù)的從屬數(shù)據(jù)。在知識發(fā)現(xiàn)中,基于核心屬性已經(jīng)足以進(jìn)行知識的發(fā)現(xiàn)。從屬數(shù)據(jù)將增大知識發(fā)現(xiàn)的計算量,對知識發(fā)現(xiàn)結(jié)果的影響較小,因而也需要進(jìn)行排除。

        3.2電力大數(shù)據(jù)的知識提取過程

        在電力大數(shù)據(jù)中,知識的提取是從多個定量數(shù)據(jù)轉(zhuǎn)化為抽象的數(shù)學(xué)表示的過程。假設(shè)當(dāng)前存在某種知識的多次實現(xiàn),使用多維數(shù)據(jù)集合K表示。電力大數(shù)據(jù)中的知識提取可表示為: 。具體步驟如下:

        (1)知識數(shù)據(jù)集獲取。從已有數(shù)據(jù)全集中,根據(jù)先驗知識,得出其中表示某種知識的數(shù)據(jù)集合K。

        (2)核心數(shù)據(jù)發(fā)現(xiàn)?;谒惴?,從數(shù)據(jù)全集中去除非核心屬性,保留核心屬性,形成數(shù)據(jù)集合K。

        (3)基于改進(jìn)云模型的知識提取。對現(xiàn)有數(shù)據(jù)集合K進(jìn)行歸一化處理,得出改進(jìn)的多維云模型 。

        (4)此時,改進(jìn)的多維云模型 即為該知識的抽象表示。

        在改進(jìn)的多維云模型中,云模型的核 表示該知識的內(nèi)涵;表示多維尺度因子I表示該知識在多個屬性下的外延;云模型的不確定性A,代表該知識在多維維度下的不確定性。改進(jìn)的多維云模型一方面可以表示該知識的抽象特征,另一方面還可以根據(jù)該抽象特征生成該知識的實現(xiàn)。

        3.3基于知識的數(shù)據(jù)生成算法

        根據(jù)知識的抽象特性生成數(shù)據(jù),是多維云模型屬性歸一化的逆向過程。

        對于已經(jīng)得到的某種知識抽象特性,可以基于知識生成近似的數(shù)據(jù)。為知識提取提供了一種抽象概念到具體數(shù)據(jù)的轉(zhuǎn)換方法。對于模擬電力領(lǐng)域中的業(yè)務(wù),構(gòu)建電力領(lǐng)域知識圖譜都具有一定的應(yīng)用價值。

        4結(jié)論及未來工作展望

        針對當(dāng)前電力大數(shù)據(jù)領(lǐng)域中的知識表達(dá)能力缺乏標(biāo)準(zhǔn)、知識提取能力相對較弱等問題展開研究,針對云模型進(jìn)行了改進(jìn),并提出了一種面向電力大數(shù)據(jù)的知識提取算法。仿真實驗驗證了該算法在數(shù)據(jù)重構(gòu)、知識提取等方面均有較好的性能。該算法電力行業(yè)大數(shù)據(jù)分析,知識圖譜構(gòu)建具有一定的參考價值。

        參考文獻(xiàn)

        [1]盛魁.混合數(shù)據(jù)的鄰域區(qū)分度增量式屬性約簡算法[J].電子學(xué)報,2020,48(04):682-696.

        [2]周峰.泛在電力物聯(lián)網(wǎng)智能感知關(guān)鍵技術(shù)發(fā)展思路[J].中國電機(jī)工程學(xué)報,2020,40(01):70-82+375.

        猜你喜歡
        電力大數(shù)據(jù)知識圖譜
        分布式技術(shù)在電力大數(shù)據(jù)高性能處理中的應(yīng)用
        電力大數(shù)據(jù)應(yīng)用研究與展望
        基于云計算技術(shù)的電力大數(shù)據(jù)預(yù)處理屬性約簡方法
        面向電力大數(shù)據(jù)的數(shù)據(jù)管理工具對比
        國內(nèi)圖書館嵌入式服務(wù)研究主題分析
        國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
        近十五年我國小學(xué)英語教學(xué)研究的熱點、問題及對策
        基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
        智富時代(2016年12期)2016-12-01 16:28:41
        電力大數(shù)據(jù)可視化系統(tǒng)開發(fā)關(guān)鍵技術(shù)研究及趨勢
        基于知識圖譜的智慧教育研究熱點與趨勢分析
        日韩精品一区二区三区中文9| 久久久久人妻一区精品| 在线人成免费视频69国产| 欧美整片第一页| 岛国av一区二区三区| 国产免费一区二区在线视频| 少妇愉情理伦片| 少妇人妻偷人精品无码视频| 免费人人av看| 黑人玩弄极品人妻系列视频| 亚洲人成网网址在线看| 四虎成人精品无码永久在线| 天堂网av在线| 男女调情视频在线观看| 欧美一区二区三区视频在线观看| 欧美一片二片午夜福利在线快| 国产日产久久福利精品一区| 亚洲中文字幕日韩综合| 亚洲av永久无码精品网址| 伊人网视频在线观看| 中文天堂一区二区三区| 一个人看的视频在线观看| 免费国产黄网站在线观看| 国产精品国产三级国产专区5o| 97久久综合精品国产丝袜长腿| 厨房人妻hd中文字幕| 国产色综合天天综合网| 国产精品女同久久免费观看| 久久久精品国产亚洲av网麻豆| 九色综合九色综合色鬼| 中文字幕福利视频| 国产一区二区三区日韩精品| 国产自拍av在线观看视频 | 国产av剧情精品麻豆| 狠狠噜狠狠狠狠丁香五月| 久久精品国产一区二区电影| 亚洲福利av一区二区| 亚洲最大免费福利视频网| 成av免费大片黄在线观看| 天啦噜国产精品亚洲精品| 亚洲国产区中文在线观看|