亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自然語言處理和Office COM組件的電量智能統(tǒng)計分析系統(tǒng)

        2018-01-03 01:54:56李新利李昕其李衛(wèi)東
        計算機應用與軟件 2017年12期
        關鍵詞:文本智能分析

        李新利 李昕其 馬 凱 李衛(wèi)東 于 磊

        1(華北電力大學控制與計算機工程學院 北京 102206) 2(國網(wǎng)遼寧省電力有限公司盤錦供電公司 遼寧 盤錦 124010) 3(國網(wǎng)河南省電力公司濟源供電公司 河南 濟源 459000)

        基于自然語言處理和OfficeCOM組件的電量智能統(tǒng)計分析系統(tǒng)

        李新利1李昕其2馬 凱1李衛(wèi)東3于 磊1

        1(華北電力大學控制與計算機工程學院 北京 102206)2(國網(wǎng)遼寧省電力有限公司盤錦供電公司 遼寧 盤錦 124010)3(國網(wǎng)河南省電力公司濟源供電公司 河南 濟源 459000)

        傳統(tǒng)電量統(tǒng)計分析采用簡單Excel功能,憑經(jīng)驗進行,不僅影響所分析的數(shù)據(jù)和分析質量,而且使供電企業(yè)難以進行正確決策?;谧匀徽Z言處理和Office COM組件,提出并設計研制一種電量智能統(tǒng)計分析系統(tǒng)。系統(tǒng)基于自然語言處理技術,分析定位各項重要指標數(shù)據(jù),建立大用戶生產(chǎn)系統(tǒng)和電量消耗模型。同時采用COM組件技術,快速提取指定Excel報表中的大量數(shù)據(jù)。對月度統(tǒng)計數(shù)據(jù)進行分析比對,生成相應表格、圖像及分析文字,自動輸出符合電力公司要求的報告文檔。實際應用表明,該系統(tǒng)提高了電力公司對社會用電量分析的速度和質量,為電力生產(chǎn)經(jīng)營提供了有力的數(shù)據(jù)支撐。

        自然語言 Office COM組件 電量統(tǒng)計 智能 數(shù)據(jù)處理

        0 引 言

        隨著社會經(jīng)濟發(fā)展,電力能源的使用越來越市場化,電力市場不斷壯大,必然會要求供電企業(yè)對自身發(fā)展進行準確定位。通過對用戶用電量分析和預測,不僅可使供電企業(yè)及時了解和保證社會用電,而且有助于供電企業(yè)進行正確決策,提高自身發(fā)展[1]。因此電量的分析預測是供電企業(yè)可靠發(fā)展的關鍵所在,對電力企業(yè)實施項目投資、生產(chǎn)經(jīng)營管理等有著重大的意義。

        目前供電公司對售電量、全社會用電量和工業(yè)用電量等的統(tǒng)計分析,僅依靠人工對照歷史數(shù)據(jù),憑借經(jīng)驗進行分析,缺乏現(xiàn)代科學手段,嚴重影響了所分析的數(shù)據(jù)和分析質量。因此研究開發(fā)電量智能統(tǒng)計分析系統(tǒng),通過建立大用戶生產(chǎn)系統(tǒng)和電量消耗模型,對月度統(tǒng)計數(shù)據(jù)進行分析比對,輸出分析結果,并結合自然語言處理技術,提高對文字信息的分析統(tǒng)計效果,切實提高統(tǒng)計工作的質量和水平,為企業(yè)生產(chǎn)經(jīng)營提供有力的數(shù)據(jù)支撐。

        1 電量智能統(tǒng)計分析系統(tǒng)特點

        電量智能統(tǒng)計分析系統(tǒng)不僅可以挖掘電力市場運行數(shù)據(jù),而且能統(tǒng)計分析電力市場運行規(guī)律,形成相應的電力月報或月度分析報告,便于預測未來發(fā)展趨勢。對應某供電公司,其社會用電統(tǒng)計月報和電力公司生產(chǎn)經(jīng)營情況月度統(tǒng)計分析報告,是對某一地區(qū)一個月里生產(chǎn)用電、生活用電、其他各公司用電和電力公司經(jīng)營情況的詳細統(tǒng)計與分析報告。對于記錄社會用電狀況,分析各產(chǎn)業(yè)的用電需求,改善電力公司的經(jīng)營情況等,具有巨大的分析和指導意義。

        通常某一地區(qū)的用電統(tǒng)計和電力公司經(jīng)營情況統(tǒng)計的原始數(shù)據(jù)中,不僅有大量的數(shù)字信息,還包含十分豐富的文字信息。這些文字信息一般包括數(shù)據(jù)表名稱、表頭信息、日期、地名、產(chǎn)業(yè)名城、企業(yè)名稱、某些現(xiàn)象的原因總結等內(nèi)容。傳統(tǒng)的報表自動化分析方法無法有效地理解和分析這些文字信息,造成信息遺漏、原始數(shù)據(jù)格式要求固定、自動生成的內(nèi)容死板、自動化程度低等問題。隨著自然語言處理技術的發(fā)展和深度學習技術的應用,中文語義分析的準確度有了很大發(fā)展[2-7]。本文基于自然語言處理方法,結合Office COM組件,提出并設計研制了電量的智能統(tǒng)計與分析系統(tǒng)。該智能系統(tǒng)具有如下特點:

        1) 自然語言處理:對原始數(shù)據(jù)表中的表頭、地名、企業(yè)名稱、原因總結等文本內(nèi)容進行自然語言處理,提取關鍵信息,并與模板庫中的文本進行語義匹配。

        2) 數(shù)據(jù)分析:基于所提取的原始數(shù)據(jù)和文字匹配情況,對重點數(shù)據(jù)進行二次計算和分析,實現(xiàn)重要數(shù)據(jù)的篩選、分類、排序及函數(shù)運算等功能。

        3) 數(shù)據(jù)挖掘:統(tǒng)計系統(tǒng)不僅能查詢單個表中數(shù)據(jù),還能查詢多個表的關聯(lián)數(shù)據(jù),具備數(shù)據(jù)挖掘功能,滿足統(tǒng)計要求。

        4) 數(shù)據(jù)顯示:統(tǒng)計系統(tǒng)可實現(xiàn)數(shù)據(jù)的表格、變化趨勢、棒圖、混合型圖表等多種顯示。

        5) 分析文檔生成:根據(jù)對數(shù)據(jù)和文本的處理分析、信息挖掘,匹配相應的模板,自動生成圖文并茂的doc格式的電力月報和經(jīng)營情況分析報告。

        2 軟件設計思想

        為了解決傳統(tǒng)自動化報表分析軟件無法高效理解和處理文本信息的缺陷,本文基于自然語言處理技術的分詞、同義詞查找、命名實體識別、情感分析等方法,結合Office COM組件接口實現(xiàn)對Excel和Word文件的協(xié)同操作,實現(xiàn)了軟件對文本信息的識別和處理。并充分利用了原始數(shù)據(jù)中的數(shù)字和文本信息,提高了軟件的智能程度。

        由于處理自然語言需要容量巨大的詞庫和優(yōu)異的計算性能,電量智能統(tǒng)計分析系統(tǒng)將需要分析的文本內(nèi)容上傳到網(wǎng)絡服務器中,通過調(diào)用服務器提供的API接口,對文本信息進行各種分析處理。同時,軟件中保留了單機的報表分析處理程序。當無法連接網(wǎng)絡服務、自然語言處理出錯、或選擇不使用自然語言處理功能時,則該系統(tǒng)按照定義的模板和算法庫中的流程,直接查找各關鍵字段,獲取并分析數(shù)據(jù),具有靈活處理功能。

        3 自然語言處理

        用電原始數(shù)據(jù)的數(shù)據(jù)表中,通常存在如下三種類型的文本數(shù)據(jù):

        1) 字段文本:用來表示數(shù)據(jù)表中一列數(shù)據(jù)的統(tǒng)稱。例如:“本月用電量”、“地區(qū)”、“累計用電量”等。

        2) 屬性文本或實體文本:數(shù)據(jù)表中某一行的屬性或某一個實體的名稱的文本。例如:“第一產(chǎn)業(yè)”、“xxx集團”、“全省合計”等。

        3) 原因分析文本:收集和統(tǒng)計分析得出的對用電情況的現(xiàn)實原因表述。例如,“受石油加工業(yè)拉動,8-11月份增速較快”,或“受xxx集團裝置故障檢修影響”等文本描述。

        對于三種類型的文本數(shù)據(jù),電量統(tǒng)計系統(tǒng)中采用了不同的自然語言處理方法進行處理。

        3.1 字段文本與實體文本的處理

        在用電情況原始數(shù)據(jù)中,經(jīng)常會出現(xiàn)一些符合人類思維的描述,尤其是在字段文本信息中,常使用不同的詞來表示同一個意思。例如:當月用電量和本月量、增長率和增速、影響變化和影響變化率等文本描述。這種描述具有模糊性和聯(lián)想性,人類易于分辨,但計算機卻很難識別?;谧匀徽Z言處理技術,電量智能統(tǒng)計分析系統(tǒng)將這些文本信息進行分詞后,采用同義詞擴展查找和語義聯(lián)想查找,識別出與模板庫中的文本信息具有相同或高相似度的文本描述,進而對這個文本描述對應的數(shù)據(jù)執(zhí)行合適的統(tǒng)計分析算法。字段文本和實體文本的處理基本流程如圖1所示。

        圖1 字段文本與實體文本處理流程

        電量智能統(tǒng)計系統(tǒng)要處理的Excel格式原始數(shù)據(jù)表,也會出現(xiàn)使用同一個詞表示兩種語義的情況。在處理這類情況時,可根據(jù)文本在表格中位置來區(qū)分具體的語義。例如,“增量”這個詞,在“本月用電量”右邊或下方的單元格中出現(xiàn),則表示“本月用電量的同比增量”;在“累計”的右邊或下方的單元格中出現(xiàn),則表示“1月至今累計用電量的同比增量”。這種情況下,在識別語義或查找關鍵字時,本文提出不僅識別語義,還要判斷文本間的位置關系,按照從左至右、從上至下的位置從屬關系來進一步判斷原始數(shù)據(jù)文本與模板文本的匹配。

        3.2 原因分析文本的處理

        原因分析文本的描述中包含大量信息,既有增長、下降等情感信息,又有“石油加工業(yè)”、“xxx集團”等行業(yè)和企業(yè)名稱信息,以及可能存在時間和地點等信息。本文在所生成的電力月報和經(jīng)營情況分析報告中,對這些信息按照人的思維邏輯進行分類顯示。采用將有利因素分為一類,不利因素分為另一類。同時在表述原因時,需要自動附加相關的數(shù)據(jù)和數(shù)據(jù)分析。例如,談及石油加工業(yè)時,需要查找原始數(shù)據(jù)中石油加工業(yè)的總體用電數(shù)據(jù)和該產(chǎn)業(yè)下的各大企業(yè)的用電數(shù)據(jù),并顯示二次計算和分析結果。在涉及“xxx集團”時,需要從原始數(shù)據(jù)表中查找這個集團的用電數(shù)據(jù),并將用電情況的分析結果文本附加在原因分析之后。為了實現(xiàn)這些功能,本文采用了情感分析和命名實體識別技術。通過分析原因的情感,將原因分為褒義、中義、貶義三類,在生成報告時,分別顯示這三類原因,并且根據(jù)人的習慣,使用不同的詞匯表述這些原因。采用命名實體識別技術,可提取原因中的行業(yè)名稱、企業(yè)名稱、地名這些信息,并進行原始數(shù)據(jù)的多表聯(lián)查,提取所有的相關數(shù)據(jù)。原因分析的文本信息基本處理流程如圖2所示。

        圖2 原因分析的文本處理流程

        4 數(shù)據(jù)處理和文件操作

        供電公司原始數(shù)據(jù)表格一般均為Excel格式,因此本文的電量智能統(tǒng)計分析系統(tǒng)采用Office COM組件接口[8-12],實現(xiàn)對Excel數(shù)據(jù)表的數(shù)據(jù)讀取、查找、繪圖、多列排序、篩選、寫入數(shù)據(jù)等操作。同時生成Word文件、Excel副本文件,以及實現(xiàn)對Word文件的文字、表格、圖表等內(nèi)容的各種操作?;谶@些操作,軟件可以協(xié)同處理Excel文件和Word文件,根據(jù)模板庫中定義的格式,生成排版規(guī)范且美觀的Word報告[13-14]。

        軟件的統(tǒng)計算法庫中,定義了多種處理分析數(shù)據(jù)的統(tǒng)計算法,并根據(jù)供電公司對電量統(tǒng)計報告的實際需求,定義了數(shù)種典型的數(shù)據(jù)處理流程和報告類型。軟件會根據(jù)工作人員的設置,對報告中不同類型的部分采用不同的處理流程,生成條理清晰、結構合理、數(shù)據(jù)豐富的統(tǒng)計報告。典型的數(shù)據(jù)處理流程如圖3所示。

        圖3 典型數(shù)據(jù)統(tǒng)計處理流程

        供電公司原始數(shù)據(jù)經(jīng)過電量智能統(tǒng)計分析系統(tǒng)處理與操作后,生成的典型報表如圖4所示。

        圖4 自動生成報表的典型樣式

        5 結 語

        本文基于自然語言處理技術,結合Office COM組件,研究并開發(fā)了電量智能統(tǒng)計分析系統(tǒng)。通過自然語言處理,加強了軟件對文本信息的識別處理能力,可以處理漢語中多詞同義的情況,并提取文本中的關鍵信息和命名實體,提高軟件的適用性和自動化程度,豐富自動化報表分析軟件的功能。采用Office COM組件編程接口開發(fā),可以自動分析處理包含用電情況原始數(shù)據(jù)的Excel文件,生成反映社會中各產(chǎn)業(yè)各地區(qū)的用電情況月報和供電公司經(jīng)營情況的經(jīng)營分析報告的Word文件,充分利用了Excel和Word軟件提供的數(shù)據(jù)和文字處理功能。該智能系統(tǒng)的使用減少了工作人員對數(shù)據(jù)表格的繁瑣操作、文本錄入及錄入錯誤,提高了數(shù)據(jù)處理和書寫報告的質量和效率。該系統(tǒng)已經(jīng)在某市供電公司中投入使用,其處理速度和生成的報告質量獲得一致肯定。

        [1] 劉迪.電力市場電量分析及預測研究[J].科技創(chuàng)新與應用,2014(35):162-162.

        [2] 邸鵬,段利國.基于復雜句式的文本情感傾向性分析[J].計算機應用與軟件,2015,32(11):57-61.

        [3] 李妍,劉茂福,姬東鴻.基于支持向量機的中文文本蘊涵識別研究[J].計算機應用與軟件,2014,31(4):51-55.

        [4] 于昕,郭浩,李海芳,等.基于自然語言處理的圖像情感語義檢索研究[J].計算機應用與軟件,2014,31(6):37-41.

        [5] 車海燕,馮鐵,張家晨,等.面向中文自然語言文檔的自動知識抽取方法[J].計算機研究與發(fā)展,2013,50(4):834-842.

        [6] 侯超.基于自然語言處理的策略生成系統(tǒng)的設計與實現(xiàn)[D].西安電子科技大學,2013.

        [7] 張雷.基于自然語言處理及語音識別方法的電信業(yè)務軟件設計[D].電子科技大學,2014.

        [8] 趙小娟.基于.NET的企業(yè)鐵路運輸調(diào)度系統(tǒng)報表系統(tǒng)設計[D].蘭州交通大學,2012.

        [9] 王丹.基于.NET的金融企業(yè)辦公自動化系統(tǒng)的設計與實現(xiàn)[D].吉林大學,2015.

        [10] 方鐘輝.基于ASP.NET的醫(yī)院辦公自動化系統(tǒng)設計與實現(xiàn)[D].大連理工大學,2014.

        [11] 王春蓉.基于ASP.NET的中小企業(yè)辦公自動化管理系統(tǒng)的設計與實現(xiàn)[D].江西財經(jīng)大學,2016.

        [12] 李佳.基于PLM的某電子企業(yè)的數(shù)據(jù)整合研究與應用[D].復旦大學,2012.

        [13] 王正敏,張?zhí)t,李永可,等.FreeMarker模板引擎在線動態(tài)生成Excel和Word文檔技術[J].計算機與現(xiàn)代化,2016(4):109-113.

        [14] 陳健.淺析利用Excel與Word生成固定格式文檔的方法[J].電腦知識與技術,2013(25):5721-5724.

        SMARTSTATISTICALANALYSISSYSTEMOFELECTRICITYBASEDONNATURALLANGUAGEPROCESSINGANDOFFICECOMCOMPONENTS

        Li Xinli1Li Xinqi2Ma Kai1Li Weidong3Yu Lei1

        1(SchoolofControlandComputerEngineering,NorthChinaPowerElectricUniversity,Beijing102206,China)2(PanjinPowerSupplyCompany,StateGridLiaoningElectricPowerCo.,Ltd.,Panjin124010,Liaoning,China)3(JiyuanPowerSupplyCompany,StateGridHenanElectricPowerCompany,Jiyuan459000,Henan,China)

        The simple Excel function is usually used in the traditional statistical analysis of electricity, with manual experience. It not only affects the quality of data and analysis, but also makes it difficult for power supply enterprises to make the right decisions. Based on the natural language processing and Office COM components, a smart statistical analysis system of electricity system is proposed and designed. The important indicators of data are analysed and located based on natural language processing technology. The model is established between large-user production systems and power consumption. At the same time, the COM component technology is used to extract quickly a large amount of data in the specified Excel report. The monthly statistical data are analysed and comprised, and appropriate forms, images and analysis of the text are generated. The report documents are automatically generated, which meet power company requirements. The practical application shows that the system improves the speed and quality of electricity consumption analysis, and provides powerful data support for power production and operation.

        Natural language Office COM components Electricity statistical Smart Data processing

        2017-02-16。中央高校基本科研業(yè)務費專項資助(2016MS48)。李新利,副教授,主研領域:模式識別,圖像處理。李昕其,助理工程師。馬凱,碩士生。李衛(wèi)東,助理工程師。于磊,工程師。

        TP3

        A

        10.3969/j.issn.1000-386x.2017.12.020

        猜你喜歡
        文本智能分析
        隱蔽失效適航要求符合性驗證分析
        在808DA上文本顯示的改善
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        久久亚洲精品无码va大香大香 | 精品人妻夜夜爽一区二区| 中文字幕一区二区av| 国产精品白浆在线观看免费| 欧美午夜精品一区二区三区电影 | 中文字幕乱码亚洲无线精品一区| 日本一区二区高清在线观看| 亚洲国产精品一区二区成人av| 国产精品成人aaaaa网站| 亚洲午夜精品久久久久久人妖| 精品一区二区三区人妻久久| 久久麻传媒亚洲av国产| 精品国产免费一区二区三区 | 亚洲日本三级| 日韩av中文字幕亚洲天| 人妻一区二区三区av| 9 9久热re在线精品视频| 国产欧美精品在线一区二区三区 | 亚洲一区二区三区av无| 伦伦影院午夜理论片| 好男人日本社区www| 男女好痛好深好爽视频一区| 亚洲av成人波多野一区二区| 中文字幕人乱码中文字幕| 亚洲熟伦熟女新五十路熟妇| 无码视频一区二区三区在线播放| 中文字幕有码在线亚洲| 大学生粉嫩无套流白浆| 欧美色aⅴ欧美综合色| 亚洲美女av一区二区| 国产一区二区三区在线蜜桃| 日日婷婷夜日日天干| 欧美黑人性色黄在线视频| 亚洲黄片av在线免费观看| 国产精品沙发午睡系列| 无码少妇a片一区二区三区| 国产免费无码9191精品| 亚洲一区二区三区精品视频| 亚洲综合在线一区二区三区| 久久免费区一区二区三波多野在| 青青草视频在线观看视频免费|