薛 茹
(西北大學(xué)現(xiàn)代學(xué)院,陜西 西安 710130)
在大數(shù)據(jù)時(shí)代,隨著不斷的發(fā)展和創(chuàng)新,政務(wù)信息化和大數(shù)據(jù)的處理越來越多。 經(jīng)濟(jì)分析系統(tǒng)能夠快速獲得經(jīng)濟(jì)發(fā)展的動(dòng)態(tài),為經(jīng)濟(jì)提供可靠的數(shù)字依據(jù)。目前,國內(nèi)大數(shù)據(jù)下經(jīng)濟(jì)系統(tǒng)設(shè)計(jì)的成功案例不多,如熊贏新等[1]、白獻(xiàn)陽等[2]分別對(duì)湖北省宏觀經(jīng)濟(jì)大數(shù)據(jù)倉庫項(xiàng)目、貴州省政府?dāng)?shù)據(jù)開放協(xié)同機(jī)制進(jìn)行了探索,李軍等[3]、崔樹紅等[4]在智慧政務(wù)和“數(shù)字政府”框架下對(duì)大數(shù)據(jù)共享的實(shí)現(xiàn)與應(yīng)用進(jìn)行了研究。 這些研究主要是針對(duì)數(shù)據(jù)共享方面的研究,可以實(shí)現(xiàn)部門的互聯(lián)、信息資源的共享、業(yè)務(wù)的協(xié)同,而通過構(gòu)建經(jīng)濟(jì)分析系統(tǒng),可以對(duì)數(shù)據(jù)進(jìn)行全面分析,通過數(shù)據(jù)進(jìn)行決策,采用數(shù)據(jù)進(jìn)行創(chuàng)新,可以為政府部門、企業(yè)以及各行各業(yè)提供快速、準(zhǔn)確、全面的經(jīng)濟(jì)信息。 大數(shù)據(jù)分析系統(tǒng)能夠形成進(jìn)行實(shí)時(shí)監(jiān)測(cè)和智能預(yù)測(cè)的經(jīng)濟(jì)分析系統(tǒng)體系。
在確定好相應(yīng)來源數(shù)據(jù)后,通過匯聚各種數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行采集與加工處理,數(shù)據(jù)采集與加工處理主要提供數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載功能,負(fù)責(zé)與前端數(shù)據(jù)源進(jìn)行交互,采集和處理數(shù)據(jù)庫、協(xié)議、文本等數(shù)據(jù)項(xiàng)[5],通過大數(shù)據(jù)平臺(tái)首先把數(shù)據(jù)加工、整合,將數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中,進(jìn)行數(shù)據(jù)的分析與展示。 在經(jīng)濟(jì)分析系統(tǒng)中,系統(tǒng)模塊主要包括數(shù)據(jù)快報(bào)、數(shù)據(jù)分析、企業(yè)跟蹤、關(guān)聯(lián)分析、綜合報(bào)表和經(jīng)濟(jì)預(yù)測(cè)模塊,系統(tǒng)框架如圖1 所示。 經(jīng)濟(jì)分析系統(tǒng)可以提供餅圖、柱狀圖、走勢(shì)圖、曲線圖等多種圖形展示。 數(shù)據(jù)快報(bào)功能模塊,可以快速提供所需數(shù)據(jù),通過這些數(shù)據(jù)隨時(shí)能夠查看經(jīng)濟(jì)的運(yùn)轉(zhuǎn)情況。 數(shù)據(jù)分析功能模塊具有強(qiáng)大的數(shù)據(jù)匯總能力和多角度的數(shù)據(jù)分析能力,支持趨勢(shì)、構(gòu)成、同比、環(huán)比、對(duì)比、排名、預(yù)警KPI 等多種分析能力。企業(yè)跟蹤模塊能夠?qū)Υ_定的目標(biāo)進(jìn)行跟蹤與分析,支持對(duì)各種經(jīng)濟(jì)運(yùn)行目標(biāo)的設(shè)定和跟蹤,以全面跟蹤目標(biāo)完成狀態(tài)和對(duì)本期目標(biāo)完成情況提前進(jìn)行預(yù)測(cè)。 關(guān)聯(lián)分析模塊提供強(qiáng)大的數(shù)據(jù)分析預(yù)測(cè)功能,支持如回歸分析、灰色關(guān)聯(lián)等常用的數(shù)據(jù)挖掘算法。 綜合評(píng)價(jià)模塊功能提供強(qiáng)大的自定義分析查詢功能,可根據(jù)需要自行組合、選擇查詢條件,形成分析報(bào)表。 經(jīng)濟(jì)預(yù)測(cè)模塊通過時(shí)間序列、灰色預(yù)測(cè)等方法進(jìn)行數(shù)據(jù)的預(yù)測(cè)分析。
圖1 系統(tǒng)框架
在經(jīng)濟(jì)分析系統(tǒng)中,以企業(yè)為例,數(shù)據(jù)快報(bào)模塊主要包括快報(bào)企業(yè)完成的情況、增加的情況和累計(jì)增加的情況。 數(shù)據(jù)分析模塊通過對(duì)企業(yè)運(yùn)行監(jiān)測(cè)分析后,形成趨勢(shì)分析、構(gòu)成分析、對(duì)比分析和排名分析。 趨勢(shì)分析主要分析指定指標(biāo)在指定時(shí)間段內(nèi)的走勢(shì)情況;構(gòu)成分析是分析指定指標(biāo)在指定時(shí)間段內(nèi)的構(gòu)成情況,反映某一領(lǐng)域?yàn)檎麄€(gè)行業(yè)的經(jīng)濟(jì)拉動(dòng)點(diǎn);對(duì)比分析指定指標(biāo)在一段時(shí)間段內(nèi)產(chǎn)業(yè)分類隨時(shí)間對(duì)比情況;排名分析則是分析指定指標(biāo)在一段時(shí)間段內(nèi)的企業(yè)排名及其變化情況。
企業(yè)的目標(biāo)跟蹤模塊用于對(duì)各種經(jīng)濟(jì)運(yùn)行目標(biāo)設(shè)定和跟蹤,可以提前預(yù)測(cè)跟蹤目標(biāo)完成狀態(tài)和完成情況。 不但可以設(shè)置各種經(jīng)濟(jì)運(yùn)行目標(biāo),而且能夠跟蹤各種經(jīng)濟(jì)運(yùn)行目標(biāo)完成狀態(tài)。
關(guān)聯(lián)分析模塊中采用回歸分析和灰色關(guān)聯(lián)分析的數(shù)據(jù)挖掘算法進(jìn)行數(shù)據(jù)分析。 采用視圖的方式來展現(xiàn),可以分為數(shù)據(jù)視圖、模型視圖、檢驗(yàn)視圖和預(yù)測(cè)視圖。 數(shù)據(jù)視圖主要用于選定初始樣本數(shù)據(jù),提供樣本數(shù)據(jù)編輯功能和趨勢(shì)圖。 模型視圖是用于顯示模型計(jì)算結(jié)果,提供模型選擇功能。 檢驗(yàn)視圖主要檢驗(yàn)前一步樣本數(shù)據(jù)計(jì)算得到的回歸模型,提供顯著性水平和查看詳細(xì)檢驗(yàn)結(jié)果功能。 預(yù)測(cè)視圖是用于對(duì)指標(biāo)的未來趨勢(shì)進(jìn)行預(yù)測(cè),提供自變量值設(shè)置功能。
綜合評(píng)價(jià)模塊使用降維方法分析多個(gè)指標(biāo)的綜合狀況,得出這些指標(biāo)的得分排名和綜合得分排名。 采用主成分分析和因子分析的方法,以視圖形式來呈現(xiàn),主成分分析視圖用于選定初始樣本數(shù)據(jù),提供樣本數(shù)據(jù)編輯功能。 因子分析視圖提供因子數(shù)量設(shè)置功能,用于顯示因子分析結(jié)果。
經(jīng)濟(jì)預(yù)測(cè)模塊根據(jù)時(shí)間序列和灰色預(yù)測(cè)的方法來預(yù)測(cè)分析,時(shí)間序列是從長(zhǎng)期趨勢(shì)、隨機(jī)因素方面分析指標(biāo)變化規(guī)律與趨勢(shì),最終得到分析綜合結(jié)果,并在此基礎(chǔ)上進(jìn)行預(yù)測(cè)。 灰色預(yù)測(cè)是用灰色模型分析,通過指標(biāo)隨時(shí)間變化規(guī)律與趨勢(shì),得到預(yù)果。 經(jīng)濟(jì)預(yù)測(cè)模塊不但提供隨機(jī)數(shù)據(jù)獲取和隨機(jī)模型分析功能,而且對(duì)經(jīng)濟(jì)指標(biāo)的未來趨勢(shì)進(jìn)行預(yù)測(cè),提供預(yù)測(cè)期數(shù)和顯示因素設(shè)置功能。
經(jīng)濟(jì)分析系統(tǒng)設(shè)計(jì)中最為重要的是關(guān)聯(lián)分析所采用的數(shù)據(jù)挖掘算法,主要包括回歸分析和灰色關(guān)聯(lián)分析。 回歸分析的基本思路是對(duì)多維空間中存在的樣本數(shù)據(jù),用特征的線性組合去擬合多維空間中點(diǎn)的分布和軌跡[6]。 回歸方式包括一元回歸、多元回歸。 回歸目的可以尋找變量間的相關(guān)程度,也可以給出變量間的相關(guān)模型。
經(jīng)濟(jì)分析系統(tǒng)中的回歸分析是以指定自變量指標(biāo)和指定因變量指標(biāo)在指定時(shí)間范圍內(nèi)、指定主要口徑和次要口徑、指定時(shí)間顆粒度的歷史數(shù)據(jù)為樣本數(shù)據(jù),分析自變量指標(biāo)對(duì)因變量指標(biāo)的貢獻(xiàn)或影響,得出模型后,可給出一個(gè)自變量指標(biāo)值來預(yù)測(cè)因變量指標(biāo)值。圖2 表示的是回歸分析中一元回歸數(shù)據(jù)視圖,通過對(duì)樣本數(shù)據(jù)的自累加或自累減,提供出樣本數(shù)據(jù)編輯功能和趨勢(shì)圖,分析結(jié)果包含原始數(shù)據(jù)、散點(diǎn)圖和統(tǒng)計(jì)描述。 圖3 表示的是回歸分析中的一元回歸模型視圖,顯示出模型回歸方程的計(jì)算公式、擬合度和標(biāo)準(zhǔn)誤差,模型結(jié)果顯示出回歸描述圖。
圖2 回歸分析中一元回歸數(shù)據(jù)視
圖3 回歸分析中一元回歸模型視
灰色關(guān)聯(lián)分析是一種多因素統(tǒng)計(jì)分析方法,它是以各因素的樣本數(shù)據(jù)為依據(jù)用灰色關(guān)聯(lián)度來描述因素間關(guān)系的強(qiáng)弱、大小和秩序。 若樣本數(shù)據(jù)反映出的兩因素變化的態(tài)勢(shì)基本一致,也就是同步變化程度高,則它們之間的關(guān)聯(lián)度較大;反之,則認(rèn)為關(guān)聯(lián)度較小。 因此,可用灰色關(guān)聯(lián)分析法來衡量某區(qū)域各個(gè)指標(biāo)之間的關(guān)聯(lián)程度[7]。
經(jīng)濟(jì)分析系統(tǒng)進(jìn)行數(shù)據(jù)分析時(shí)的影響因子錯(cuò)綜復(fù)雜,難以用精確的模型進(jìn)行定量研究,而灰色關(guān)聯(lián)分析是根據(jù)因子間幾何形狀的相似程度來衡量各因子關(guān)聯(lián)度的方法,因子間幾何形狀越相似,其關(guān)聯(lián)程度就越大,發(fā)展變化趨勢(shì)也越接近[8]。 無論樣本量多少以及樣本有無規(guī)律,灰色關(guān)聯(lián)分析法都能夠適用,為經(jīng)濟(jì)分析系統(tǒng)影響因素的定量分析提供了比較好的途徑,關(guān)聯(lián)度計(jì)算時(shí)首先可以確定出比較和參考的序列,然后將選擇的序列建立關(guān)聯(lián)系數(shù)矩陣,接著計(jì)算出關(guān)聯(lián)系數(shù),得出關(guān)系系數(shù)圖,最后得到關(guān)聯(lián)度[9]。
經(jīng)濟(jì)分析系統(tǒng)中的灰色關(guān)聯(lián)分析通過樣本數(shù)據(jù),具體分析了工業(yè)增加率、產(chǎn)銷率、工業(yè)增加值、工業(yè)總產(chǎn)值、工業(yè)銷售產(chǎn)值和GDP 在數(shù)量上多個(gè)指標(biāo)間的關(guān)聯(lián)程度,從而得出這些指標(biāo)的灰色關(guān)聯(lián)系數(shù)圖、關(guān)聯(lián)系數(shù)矩陣,如圖4 所示。
圖4 灰色關(guān)聯(lián)的關(guān)系系數(shù)圖和關(guān)聯(lián)系數(shù)矩陣
在大數(shù)據(jù)時(shí)代,本研究借助經(jīng)濟(jì)分析系統(tǒng),通過進(jìn)行數(shù)據(jù)分析,可以針對(duì)大數(shù)據(jù)進(jìn)行經(jīng)濟(jì)分析和預(yù)測(cè),特別在關(guān)聯(lián)分析的數(shù)據(jù)挖掘方面做出有益的探索。 本文運(yùn)用回歸分析、灰色關(guān)聯(lián)的數(shù)據(jù)挖掘算法,可以挖掘出關(guān)聯(lián)性強(qiáng)的數(shù)據(jù)關(guān)系,能夠進(jìn)行有效的數(shù)據(jù)分析,并作出可靠的經(jīng)濟(jì)預(yù)測(cè),提高預(yù)測(cè)的精準(zhǔn)度,為政府部門或企業(yè)進(jìn)行調(diào)控、精準(zhǔn)施策提供有用的參考,具有一定的價(jià)值。