亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自然語言處理和Office COM組件的電量智能統(tǒng)計(jì)分析系統(tǒng)

        2018-01-03 01:54:56李新利李昕其李衛(wèi)東
        關(guān)鍵詞:原始數(shù)據(jù)電量用電

        李新利 李昕其 馬 凱 李衛(wèi)東 于 磊

        1(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院 北京 102206) 2(國網(wǎng)遼寧省電力有限公司盤錦供電公司 遼寧 盤錦 124010) 3(國網(wǎng)河南省電力公司濟(jì)源供電公司 河南 濟(jì)源 459000)

        基于自然語言處理和OfficeCOM組件的電量智能統(tǒng)計(jì)分析系統(tǒng)

        李新利1李昕其2馬 凱1李衛(wèi)東3于 磊1

        1(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院 北京 102206)2(國網(wǎng)遼寧省電力有限公司盤錦供電公司 遼寧 盤錦 124010)3(國網(wǎng)河南省電力公司濟(jì)源供電公司 河南 濟(jì)源 459000)

        傳統(tǒng)電量統(tǒng)計(jì)分析采用簡單Excel功能,憑經(jīng)驗(yàn)進(jìn)行,不僅影響所分析的數(shù)據(jù)和分析質(zhì)量,而且使供電企業(yè)難以進(jìn)行正確決策。基于自然語言處理和Office COM組件,提出并設(shè)計(jì)研制一種電量智能統(tǒng)計(jì)分析系統(tǒng)。系統(tǒng)基于自然語言處理技術(shù),分析定位各項(xiàng)重要指標(biāo)數(shù)據(jù),建立大用戶生產(chǎn)系統(tǒng)和電量消耗模型。同時(shí)采用COM組件技術(shù),快速提取指定Excel報(bào)表中的大量數(shù)據(jù)。對月度統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析比對,生成相應(yīng)表格、圖像及分析文字,自動(dòng)輸出符合電力公司要求的報(bào)告文檔。實(shí)際應(yīng)用表明,該系統(tǒng)提高了電力公司對社會(huì)用電量分析的速度和質(zhì)量,為電力生產(chǎn)經(jīng)營提供了有力的數(shù)據(jù)支撐。

        自然語言 Office COM組件 電量統(tǒng)計(jì) 智能 數(shù)據(jù)處理

        0 引 言

        隨著社會(huì)經(jīng)濟(jì)發(fā)展,電力能源的使用越來越市場化,電力市場不斷壯大,必然會(huì)要求供電企業(yè)對自身發(fā)展進(jìn)行準(zhǔn)確定位。通過對用戶用電量分析和預(yù)測,不僅可使供電企業(yè)及時(shí)了解和保證社會(huì)用電,而且有助于供電企業(yè)進(jìn)行正確決策,提高自身發(fā)展[1]。因此電量的分析預(yù)測是供電企業(yè)可靠發(fā)展的關(guān)鍵所在,對電力企業(yè)實(shí)施項(xiàng)目投資、生產(chǎn)經(jīng)營管理等有著重大的意義。

        目前供電公司對售電量、全社會(huì)用電量和工業(yè)用電量等的統(tǒng)計(jì)分析,僅依靠人工對照歷史數(shù)據(jù),憑借經(jīng)驗(yàn)進(jìn)行分析,缺乏現(xiàn)代科學(xué)手段,嚴(yán)重影響了所分析的數(shù)據(jù)和分析質(zhì)量。因此研究開發(fā)電量智能統(tǒng)計(jì)分析系統(tǒng),通過建立大用戶生產(chǎn)系統(tǒng)和電量消耗模型,對月度統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析比對,輸出分析結(jié)果,并結(jié)合自然語言處理技術(shù),提高對文字信息的分析統(tǒng)計(jì)效果,切實(shí)提高統(tǒng)計(jì)工作的質(zhì)量和水平,為企業(yè)生產(chǎn)經(jīng)營提供有力的數(shù)據(jù)支撐。

        1 電量智能統(tǒng)計(jì)分析系統(tǒng)特點(diǎn)

        電量智能統(tǒng)計(jì)分析系統(tǒng)不僅可以挖掘電力市場運(yùn)行數(shù)據(jù),而且能統(tǒng)計(jì)分析電力市場運(yùn)行規(guī)律,形成相應(yīng)的電力月報(bào)或月度分析報(bào)告,便于預(yù)測未來發(fā)展趨勢。對應(yīng)某供電公司,其社會(huì)用電統(tǒng)計(jì)月報(bào)和電力公司生產(chǎn)經(jīng)營情況月度統(tǒng)計(jì)分析報(bào)告,是對某一地區(qū)一個(gè)月里生產(chǎn)用電、生活用電、其他各公司用電和電力公司經(jīng)營情況的詳細(xì)統(tǒng)計(jì)與分析報(bào)告。對于記錄社會(huì)用電狀況,分析各產(chǎn)業(yè)的用電需求,改善電力公司的經(jīng)營情況等,具有巨大的分析和指導(dǎo)意義。

        通常某一地區(qū)的用電統(tǒng)計(jì)和電力公司經(jīng)營情況統(tǒng)計(jì)的原始數(shù)據(jù)中,不僅有大量的數(shù)字信息,還包含十分豐富的文字信息。這些文字信息一般包括數(shù)據(jù)表名稱、表頭信息、日期、地名、產(chǎn)業(yè)名城、企業(yè)名稱、某些現(xiàn)象的原因總結(jié)等內(nèi)容。傳統(tǒng)的報(bào)表自動(dòng)化分析方法無法有效地理解和分析這些文字信息,造成信息遺漏、原始數(shù)據(jù)格式要求固定、自動(dòng)生成的內(nèi)容死板、自動(dòng)化程度低等問題。隨著自然語言處理技術(shù)的發(fā)展和深度學(xué)習(xí)技術(shù)的應(yīng)用,中文語義分析的準(zhǔn)確度有了很大發(fā)展[2-7]。本文基于自然語言處理方法,結(jié)合Office COM組件,提出并設(shè)計(jì)研制了電量的智能統(tǒng)計(jì)與分析系統(tǒng)。該智能系統(tǒng)具有如下特點(diǎn):

        1) 自然語言處理:對原始數(shù)據(jù)表中的表頭、地名、企業(yè)名稱、原因總結(jié)等文本內(nèi)容進(jìn)行自然語言處理,提取關(guān)鍵信息,并與模板庫中的文本進(jìn)行語義匹配。

        2) 數(shù)據(jù)分析:基于所提取的原始數(shù)據(jù)和文字匹配情況,對重點(diǎn)數(shù)據(jù)進(jìn)行二次計(jì)算和分析,實(shí)現(xiàn)重要數(shù)據(jù)的篩選、分類、排序及函數(shù)運(yùn)算等功能。

        3) 數(shù)據(jù)挖掘:統(tǒng)計(jì)系統(tǒng)不僅能查詢單個(gè)表中數(shù)據(jù),還能查詢多個(gè)表的關(guān)聯(lián)數(shù)據(jù),具備數(shù)據(jù)挖掘功能,滿足統(tǒng)計(jì)要求。

        4) 數(shù)據(jù)顯示:統(tǒng)計(jì)系統(tǒng)可實(shí)現(xiàn)數(shù)據(jù)的表格、變化趨勢、棒圖、混合型圖表等多種顯示。

        5) 分析文檔生成:根據(jù)對數(shù)據(jù)和文本的處理分析、信息挖掘,匹配相應(yīng)的模板,自動(dòng)生成圖文并茂的doc格式的電力月報(bào)和經(jīng)營情況分析報(bào)告。

        2 軟件設(shè)計(jì)思想

        為了解決傳統(tǒng)自動(dòng)化報(bào)表分析軟件無法高效理解和處理文本信息的缺陷,本文基于自然語言處理技術(shù)的分詞、同義詞查找、命名實(shí)體識別、情感分析等方法,結(jié)合Office COM組件接口實(shí)現(xiàn)對Excel和Word文件的協(xié)同操作,實(shí)現(xiàn)了軟件對文本信息的識別和處理。并充分利用了原始數(shù)據(jù)中的數(shù)字和文本信息,提高了軟件的智能程度。

        由于處理自然語言需要容量巨大的詞庫和優(yōu)異的計(jì)算性能,電量智能統(tǒng)計(jì)分析系統(tǒng)將需要分析的文本內(nèi)容上傳到網(wǎng)絡(luò)服務(wù)器中,通過調(diào)用服務(wù)器提供的API接口,對文本信息進(jìn)行各種分析處理。同時(shí),軟件中保留了單機(jī)的報(bào)表分析處理程序。當(dāng)無法連接網(wǎng)絡(luò)服務(wù)、自然語言處理出錯(cuò)、或選擇不使用自然語言處理功能時(shí),則該系統(tǒng)按照定義的模板和算法庫中的流程,直接查找各關(guān)鍵字段,獲取并分析數(shù)據(jù),具有靈活處理功能。

        3 自然語言處理

        用電原始數(shù)據(jù)的數(shù)據(jù)表中,通常存在如下三種類型的文本數(shù)據(jù):

        1) 字段文本:用來表示數(shù)據(jù)表中一列數(shù)據(jù)的統(tǒng)稱。例如:“本月用電量”、“地區(qū)”、“累計(jì)用電量”等。

        2) 屬性文本或?qū)嶓w文本:數(shù)據(jù)表中某一行的屬性或某一個(gè)實(shí)體的名稱的文本。例如:“第一產(chǎn)業(yè)”、“xxx集團(tuán)”、“全省合計(jì)”等。

        3) 原因分析文本:收集和統(tǒng)計(jì)分析得出的對用電情況的現(xiàn)實(shí)原因表述。例如,“受石油加工業(yè)拉動(dòng),8-11月份增速較快”,或“受xxx集團(tuán)裝置故障檢修影響”等文本描述。

        對于三種類型的文本數(shù)據(jù),電量統(tǒng)計(jì)系統(tǒng)中采用了不同的自然語言處理方法進(jìn)行處理。

        3.1 字段文本與實(shí)體文本的處理

        在用電情況原始數(shù)據(jù)中,經(jīng)常會(huì)出現(xiàn)一些符合人類思維的描述,尤其是在字段文本信息中,常使用不同的詞來表示同一個(gè)意思。例如:當(dāng)月用電量和本月量、增長率和增速、影響變化和影響變化率等文本描述。這種描述具有模糊性和聯(lián)想性,人類易于分辨,但計(jì)算機(jī)卻很難識別?;谧匀徽Z言處理技術(shù),電量智能統(tǒng)計(jì)分析系統(tǒng)將這些文本信息進(jìn)行分詞后,采用同義詞擴(kuò)展查找和語義聯(lián)想查找,識別出與模板庫中的文本信息具有相同或高相似度的文本描述,進(jìn)而對這個(gè)文本描述對應(yīng)的數(shù)據(jù)執(zhí)行合適的統(tǒng)計(jì)分析算法。字段文本和實(shí)體文本的處理基本流程如圖1所示。

        圖1 字段文本與實(shí)體文本處理流程

        電量智能統(tǒng)計(jì)系統(tǒng)要處理的Excel格式原始數(shù)據(jù)表,也會(huì)出現(xiàn)使用同一個(gè)詞表示兩種語義的情況。在處理這類情況時(shí),可根據(jù)文本在表格中位置來區(qū)分具體的語義。例如,“增量”這個(gè)詞,在“本月用電量”右邊或下方的單元格中出現(xiàn),則表示“本月用電量的同比增量”;在“累計(jì)”的右邊或下方的單元格中出現(xiàn),則表示“1月至今累計(jì)用電量的同比增量”。這種情況下,在識別語義或查找關(guān)鍵字時(shí),本文提出不僅識別語義,還要判斷文本間的位置關(guān)系,按照從左至右、從上至下的位置從屬關(guān)系來進(jìn)一步判斷原始數(shù)據(jù)文本與模板文本的匹配。

        3.2 原因分析文本的處理

        原因分析文本的描述中包含大量信息,既有增長、下降等情感信息,又有“石油加工業(yè)”、“xxx集團(tuán)”等行業(yè)和企業(yè)名稱信息,以及可能存在時(shí)間和地點(diǎn)等信息。本文在所生成的電力月報(bào)和經(jīng)營情況分析報(bào)告中,對這些信息按照人的思維邏輯進(jìn)行分類顯示。采用將有利因素分為一類,不利因素分為另一類。同時(shí)在表述原因時(shí),需要自動(dòng)附加相關(guān)的數(shù)據(jù)和數(shù)據(jù)分析。例如,談及石油加工業(yè)時(shí),需要查找原始數(shù)據(jù)中石油加工業(yè)的總體用電數(shù)據(jù)和該產(chǎn)業(yè)下的各大企業(yè)的用電數(shù)據(jù),并顯示二次計(jì)算和分析結(jié)果。在涉及“xxx集團(tuán)”時(shí),需要從原始數(shù)據(jù)表中查找這個(gè)集團(tuán)的用電數(shù)據(jù),并將用電情況的分析結(jié)果文本附加在原因分析之后。為了實(shí)現(xiàn)這些功能,本文采用了情感分析和命名實(shí)體識別技術(shù)。通過分析原因的情感,將原因分為褒義、中義、貶義三類,在生成報(bào)告時(shí),分別顯示這三類原因,并且根據(jù)人的習(xí)慣,使用不同的詞匯表述這些原因。采用命名實(shí)體識別技術(shù),可提取原因中的行業(yè)名稱、企業(yè)名稱、地名這些信息,并進(jìn)行原始數(shù)據(jù)的多表聯(lián)查,提取所有的相關(guān)數(shù)據(jù)。原因分析的文本信息基本處理流程如圖2所示。

        圖2 原因分析的文本處理流程

        4 數(shù)據(jù)處理和文件操作

        供電公司原始數(shù)據(jù)表格一般均為Excel格式,因此本文的電量智能統(tǒng)計(jì)分析系統(tǒng)采用Office COM組件接口[8-12],實(shí)現(xiàn)對Excel數(shù)據(jù)表的數(shù)據(jù)讀取、查找、繪圖、多列排序、篩選、寫入數(shù)據(jù)等操作。同時(shí)生成Word文件、Excel副本文件,以及實(shí)現(xiàn)對Word文件的文字、表格、圖表等內(nèi)容的各種操作。基于這些操作,軟件可以協(xié)同處理Excel文件和Word文件,根據(jù)模板庫中定義的格式,生成排版規(guī)范且美觀的Word報(bào)告[13-14]。

        軟件的統(tǒng)計(jì)算法庫中,定義了多種處理分析數(shù)據(jù)的統(tǒng)計(jì)算法,并根據(jù)供電公司對電量統(tǒng)計(jì)報(bào)告的實(shí)際需求,定義了數(shù)種典型的數(shù)據(jù)處理流程和報(bào)告類型。軟件會(huì)根據(jù)工作人員的設(shè)置,對報(bào)告中不同類型的部分采用不同的處理流程,生成條理清晰、結(jié)構(gòu)合理、數(shù)據(jù)豐富的統(tǒng)計(jì)報(bào)告。典型的數(shù)據(jù)處理流程如圖3所示。

        圖3 典型數(shù)據(jù)統(tǒng)計(jì)處理流程

        供電公司原始數(shù)據(jù)經(jīng)過電量智能統(tǒng)計(jì)分析系統(tǒng)處理與操作后,生成的典型報(bào)表如圖4所示。

        圖4 自動(dòng)生成報(bào)表的典型樣式

        5 結(jié) 語

        本文基于自然語言處理技術(shù),結(jié)合Office COM組件,研究并開發(fā)了電量智能統(tǒng)計(jì)分析系統(tǒng)。通過自然語言處理,加強(qiáng)了軟件對文本信息的識別處理能力,可以處理漢語中多詞同義的情況,并提取文本中的關(guān)鍵信息和命名實(shí)體,提高軟件的適用性和自動(dòng)化程度,豐富自動(dòng)化報(bào)表分析軟件的功能。采用Office COM組件編程接口開發(fā),可以自動(dòng)分析處理包含用電情況原始數(shù)據(jù)的Excel文件,生成反映社會(huì)中各產(chǎn)業(yè)各地區(qū)的用電情況月報(bào)和供電公司經(jīng)營情況的經(jīng)營分析報(bào)告的Word文件,充分利用了Excel和Word軟件提供的數(shù)據(jù)和文字處理功能。該智能系統(tǒng)的使用減少了工作人員對數(shù)據(jù)表格的繁瑣操作、文本錄入及錄入錯(cuò)誤,提高了數(shù)據(jù)處理和書寫報(bào)告的質(zhì)量和效率。該系統(tǒng)已經(jīng)在某市供電公司中投入使用,其處理速度和生成的報(bào)告質(zhì)量獲得一致肯定。

        [1] 劉迪.電力市場電量分析及預(yù)測研究[J].科技創(chuàng)新與應(yīng)用,2014(35):162-162.

        [2] 邸鵬,段利國.基于復(fù)雜句式的文本情感傾向性分析[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(11):57-61.

        [3] 李妍,劉茂福,姬東鴻.基于支持向量機(jī)的中文文本蘊(yùn)涵識別研究[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(4):51-55.

        [4] 于昕,郭浩,李海芳,等.基于自然語言處理的圖像情感語義檢索研究[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(6):37-41.

        [5] 車海燕,馮鐵,張家晨,等.面向中文自然語言文檔的自動(dòng)知識抽取方法[J].計(jì)算機(jī)研究與發(fā)展,2013,50(4):834-842.

        [6] 侯超.基于自然語言處理的策略生成系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].西安電子科技大學(xué),2013.

        [7] 張雷.基于自然語言處理及語音識別方法的電信業(yè)務(wù)軟件設(shè)計(jì)[D].電子科技大學(xué),2014.

        [8] 趙小娟.基于.NET的企業(yè)鐵路運(yùn)輸調(diào)度系統(tǒng)報(bào)表系統(tǒng)設(shè)計(jì)[D].蘭州交通大學(xué),2012.

        [9] 王丹.基于.NET的金融企業(yè)辦公自動(dòng)化系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].吉林大學(xué),2015.

        [10] 方鐘輝.基于ASP.NET的醫(yī)院辦公自動(dòng)化系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].大連理工大學(xué),2014.

        [11] 王春蓉.基于ASP.NET的中小企業(yè)辦公自動(dòng)化管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].江西財(cái)經(jīng)大學(xué),2016.

        [12] 李佳.基于PLM的某電子企業(yè)的數(shù)據(jù)整合研究與應(yīng)用[D].復(fù)旦大學(xué),2012.

        [13] 王正敏,張?zhí)t,李永可,等.FreeMarker模板引擎在線動(dòng)態(tài)生成Excel和Word文檔技術(shù)[J].計(jì)算機(jī)與現(xiàn)代化,2016(4):109-113.

        [14] 陳健.淺析利用Excel與Word生成固定格式文檔的方法[J].電腦知識與技術(shù),2013(25):5721-5724.

        SMARTSTATISTICALANALYSISSYSTEMOFELECTRICITYBASEDONNATURALLANGUAGEPROCESSINGANDOFFICECOMCOMPONENTS

        Li Xinli1Li Xinqi2Ma Kai1Li Weidong3Yu Lei1

        1(SchoolofControlandComputerEngineering,NorthChinaPowerElectricUniversity,Beijing102206,China)2(PanjinPowerSupplyCompany,StateGridLiaoningElectricPowerCo.,Ltd.,Panjin124010,Liaoning,China)3(JiyuanPowerSupplyCompany,StateGridHenanElectricPowerCompany,Jiyuan459000,Henan,China)

        The simple Excel function is usually used in the traditional statistical analysis of electricity, with manual experience. It not only affects the quality of data and analysis, but also makes it difficult for power supply enterprises to make the right decisions. Based on the natural language processing and Office COM components, a smart statistical analysis system of electricity system is proposed and designed. The important indicators of data are analysed and located based on natural language processing technology. The model is established between large-user production systems and power consumption. At the same time, the COM component technology is used to extract quickly a large amount of data in the specified Excel report. The monthly statistical data are analysed and comprised, and appropriate forms, images and analysis of the text are generated. The report documents are automatically generated, which meet power company requirements. The practical application shows that the system improves the speed and quality of electricity consumption analysis, and provides powerful data support for power production and operation.

        Natural language Office COM components Electricity statistical Smart Data processing

        2017-02-16。中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資助(2016MS48)。李新利,副教授,主研領(lǐng)域:模式識別,圖像處理。李昕其,助理工程師。馬凱,碩士生。李衛(wèi)東,助理工程師。于磊,工程師。

        TP3

        A

        10.3969/j.issn.1000-386x.2017.12.020

        猜你喜歡
        原始數(shù)據(jù)電量用電
        用電安全
        GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
        電量越低越透明的手機(jī)
        用煤用電用氣保障工作的通知
        受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
        安全用電知識多
        用電安全要注意
        四川2018年7月轉(zhuǎn)讓交易結(jié)果:申報(bào)轉(zhuǎn)讓電量11.515 63億千瓦時(shí)
        全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級自動(dòng)駕駛
        汽車零部件(2017年4期)2017-07-12 17:05:53
        電量隔離傳感器測試儀的研制
        国产又粗又猛又黄色呦呦| 国偷自产视频一区二区久| 午夜精品久久久久成人| 人妻AV无码一区二区三区奥田咲| 久久伊人网久久伊人网| 自拍成人免费在线视频| 亚洲中文字幕无码天然素人在线| 最近免费中文字幕| 999久久久免费精品国产牛牛| 人妻av在线一区二区三区| 国模gogo无码人体啪啪| 欧洲熟妇色xxxxx欧美老妇伦| 免费毛片在线视频| 国产亚洲精品高清视频| 精品人妻va一区二区三区| 国产中文字幕乱人伦在线观看| 欧美在线区| 日韩在线精品视频免费| 国产一区二区三区三区四区精品| 久久国产精品久久久久久| 亚洲熟妇色xxxxx欧美老妇| 国产黑色丝袜在线观看网站91| 日韩精品在线视频一二三 | 成人无码激情视频在线观看| 我揉搓少妇好久没做高潮| 亚洲高清乱码午夜电影网| 国产精品久久久av久久久| 亚洲AV无码成人精品区H| 国产一区二区av免费观看| 国产md视频一区二区三区| 亚洲无毛片| 一本大道加勒比东京热| 99国产精品久久99久久久| 7777奇米四色成人眼影| 91精品日本久久久久久牛牛| 国产麻豆一区二区三区在| 国产乱子伦| 国产精品jizz观看| 肉丝高跟国产精品啪啪| 亚洲 欧美 偷自乱 图片| 免费无码午夜福利片69|