亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測

        2020-07-23 08:54:49馮璐
        現(xiàn)代電子技術(shù) 2020年14期
        關(guān)鍵詞:系統(tǒng)測試仿真實驗大數(shù)據(jù)分析

        馮璐

        摘? 要: 為了克服檔案信息管理成本預(yù)測過程存在的問題,以提高檔案信息管理成本預(yù)測精度為目標(biāo),設(shè)計基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測模型。首先分析檔案信息管理成本預(yù)測的研究現(xiàn)狀,找到引起檔案信息管理成本預(yù)測誤差大的原因;然后采集檔案信息管理成本的歷史數(shù)據(jù),并引入大數(shù)據(jù)分析技術(shù),即極限學(xué)習(xí)機(jī)對檔案信息管理成本進(jìn)行建模預(yù)測;最后進(jìn)行檔案信息管理成本預(yù)測仿真對比實驗。測試結(jié)果表明,大數(shù)據(jù)分析技術(shù)可以準(zhǔn)確刻畫檔案信息管理成本的變化規(guī)律,獲得了高精度的檔案信息管理成本預(yù)測結(jié)果,并且檔案信息管理成本預(yù)測偏差要小于當(dāng)前其他檔案信息管理成本預(yù)測模型,具有更高的實際應(yīng)用價值。

        關(guān)鍵詞: 檔案信息管理; 成本預(yù)測; 大數(shù)據(jù)分析; 建模預(yù)測; 仿真實驗; 系統(tǒng)測試

        中圖分類號: TN911?34; TP391? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)14?0094?03

        Archival information management cost prediction based on big data analysis technology

        FENG Lu

        (MOE Key Laboratory of Engineering Bionics, Jilin University, Changchun 130000, China)

        Abstract: A model of archival information management cost prediction based on large data analysis technology is designed to overcome the problems existing in the process of cost prediction of archival information management and improve the accuracy of the cost prediction of archival information management. The research status of the cost prediction of the archival information management is analyzed to find out the reasons why the error of the cost prediction of archival information management is great. The historical data of the cost of archival information management is collected and the big data analysis technology (extreme learning machine) is introduced to perform the modeling forecasting for the cost of archival information management. The simulation comparative experiment of the cost prediction of archival information management was carried out. The testing results show that the big data analysis technology can accurately describe the changes rule of the cost of archival information management, the proposed cost prediction model can obtain high?precision cost prediction results of archival information management, and the deviation of the archival information management cost prediction of the model is smaller than that of the other current archival information management models. It has higher practical application value.

        Keywords: archival information management; cost prediction; large data analysis; modeling forecasting; simulation experiment; system testing

        檔案信息對一個單位或者個人來說,至關(guān)重要,近年來,人們對檔案信息管理要求日益提高[1?3]。傳統(tǒng)的檔案信息管理方式為手工方式,工作量大,容易出錯,無法適應(yīng)檔案信息向大規(guī)模方向發(fā)展要求[4]。隨著信息技術(shù)、計算機(jī)技術(shù)、自動化技術(shù)的不斷發(fā)展和融合,出現(xiàn)了許多檔案信息自動管理系統(tǒng)[5?6]。

        針對當(dāng)前檔案信息管理成本預(yù)測模型存在一些弊端,為了減少檔案信息管理成本,獲得高精度的檔案信息管理成本預(yù)測結(jié)果,提出基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測模型,并通過具體的應(yīng)用實例分析本文提出的檔案信息管理成本預(yù)測模型的有效性和優(yōu)越性。

        1? 檔案信息管理成本預(yù)測的研究現(xiàn)狀

        檔案信息管理成本預(yù)測研究可以劃分為兩個階段:第一個階段為線性建模階段;第二階段為非線性建模階段[7?9]。線性建模階段的主要方法為:一元線性回歸方法、多元線性回歸方法。它們根據(jù)檔案信息管理成本特點,分析影響因素與檔案信息管理成本之間的關(guān)系,對于簡單檔案信息管理成本預(yù)測問題,預(yù)測精度高、時間短,最為嚴(yán)重的缺陷是沒有考慮檔案信息管理成本的隨機(jī)性變化特點,預(yù)測結(jié)果可靠性低[10?11]。非線性建模階段主要方法包括:貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò),尤其是人工神經(jīng)網(wǎng)絡(luò)對檔案信息管理成本的隨機(jī)性變化特點擬合效果好,成為當(dāng)前檔案信息管理成本預(yù)測的主要建模工具。在實際應(yīng)用中,人工神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、計算機(jī)空間復(fù)雜度高等不足,使得檔案信息管理成本擬合精度高,但是預(yù)測錯誤率卻很高,即預(yù)測結(jié)果的“過擬合”現(xiàn)象[12]。近年來,隨著大數(shù)據(jù)分析技術(shù)的涌現(xiàn),為檔案信息管理成本預(yù)測提供了各種可能,其中極限學(xué)習(xí)機(jī)就是一種經(jīng)典的大數(shù)據(jù)分析技術(shù)。為此,本文將其引入到檔案信息管理成本預(yù)測建模過程中,對極限學(xué)習(xí)機(jī)存在的問題進(jìn)行解決[13?15]。

        2? 模型設(shè)計

        2.1 極限學(xué)習(xí)機(jī)算法

        人工神經(jīng)網(wǎng)絡(luò)是一種模擬人大腦傳遞信息的機(jī)器學(xué)習(xí)理論,通常為3層結(jié)構(gòu),能夠?qū)栴}的數(shù)據(jù)之間關(guān)聯(lián)進(jìn)行挖掘。在實際應(yīng)用中,其存在許多缺陷,如:運算速度較慢、容易陷入局部最優(yōu)、難以獲得最佳的預(yù)測結(jié)果。在前人研究成果的基礎(chǔ)上,有學(xué)者提出極限學(xué)習(xí)機(jī)算法。極限學(xué)習(xí)機(jī)通過隨機(jī)設(shè)置各層之間的連接權(quán)值和閾值,在訓(xùn)練過程中不需要對連接權(quán)值和閾值進(jìn)行修改,僅只需要設(shè)置隱含層節(jié)點數(shù),就可以對問題進(jìn)行求解,克服了傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)存在的局限性。與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)相比,極限學(xué)習(xí)機(jī)的優(yōu)點如表1所示。

        設(shè)數(shù)據(jù)為:[{(xi,ti)}Ni=1],[xi=[xi1,xi2,…,xin]T],[ti=[ti1,ti2,…,tim]T],極限學(xué)習(xí)機(jī)算法的隱含層節(jié)點數(shù)為L,極限學(xué)習(xí)機(jī)算法可以表示為:

        [tj=i=1lβig(wi?xj+bi),? j=1,2,…,n] (1)

        式中:[βi]表示輸出權(quán)值;g()表示激活函數(shù);[wi]和[bi]分別表示連接權(quán)重和閾值。

        展開式(1)得到:

        [tj=t1jt2j?tmj=i=1lβi1g(wi?xj+bi)i=1lβi2g(wi?xj+bi)? ? ? ? ? ? ??i=1lβimg(wi?xj+bi)]? ? ? ? (2)

        式中:[wi=[wi1,wi2,…,win]T];[xj=[xj1,xj2,…,xjn]T]。

        將式(2)采用矩陣形式進(jìn)行描述,可變?yōu)椋?/p>

        [Hβ=T′]? ? ? ? ? ? ? ? ? ? ? (3)

        輸出權(quán)值的計算公式為:

        [β=H-1T′]? ? ? ? ? ? ? ? ? ? ? (4)

        當(dāng)滿足式(4)時,需要極限學(xué)習(xí)機(jī)算法的擬合誤差為零,在實際應(yīng)用中,是可能保證擬合誤差為零的。因此,為了使極限學(xué)習(xí)機(jī)算法的結(jié)果擬合效果更好,使[Hβ-T′]的誤差最小,根據(jù)廣義逆的理論,可以得到:

        [β*=H+T′]? ? ? ? ? ? ? ? ? ? ? (5)

        式中,H+表示H的廣義逆,其可以通過奇異值分解法得到。

        wi和bi的值對極限學(xué)習(xí)機(jī)的性能影響很大,通常情況下,采用隨機(jī)方式進(jìn)行設(shè)置,導(dǎo)致極限學(xué)習(xí)機(jī)的預(yù)測精度比較低。本文采用粒子群算法確定wi和bi的值。

        2.2 粒子群算法

        粒子群算法是一種模擬鳥群覓食的智能優(yōu)化算法。每只鳥在覓食的過程中,會搜索其周圍區(qū)域,根據(jù)周圍區(qū)域搜索結(jié)果,確定下一步的飛行速度和方向,粒子當(dāng)前發(fā)現(xiàn)的最優(yōu)值和全局最優(yōu)值分別為:Pbest和Gbest。在迭代過程中,粒子根據(jù)這兩個值更新其速度和位置,具體為

        [vk+1i,d=vki,d+c1?rand()(Pbestki,d-xki,d)+? ? ? ? ? ? c2?rand()(Gbestki,d-xki,d)]? ? ?(6)

        [xk+1i,d=xki,d+vki,d] (7)

        為了獲得更好的全局尋優(yōu)能力,引入慣性權(quán)重w,式(6)變?yōu)椋?/p>

        [vk+1i,d=w?vki,d+c1?rand()(Pbestki,d-xki,d)+? ? ? ? ? ? c2?rand()(Gbestki,d-xki,d)]? ? ?(8)

        2.3 基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測步驟

        1) 采集檔案信息管理成本的歷史樣本數(shù)據(jù),并剔除數(shù)據(jù)不全的樣本。

        2) 確定極限學(xué)習(xí)機(jī)的各層節(jié)點,從而產(chǎn)生極限學(xué)習(xí)機(jī)的拓?fù)浣Y(jié)構(gòu)。

        3) 初始化粒子群算法的參數(shù),而且將極限學(xué)習(xí)機(jī)的wi和bi作為粒子位置,并且確定wi和bi的取值范圍。

        4) 采用檔案信息管理成本預(yù)測精度作為粒子群的適應(yīng)度函數(shù),根據(jù)適應(yīng)度函數(shù)值得到Pbest和Gbest。

        5) 根據(jù)式(8)更新粒子的位置和速度,并且增加迭代次數(shù)。

        6) 如果當(dāng)前迭代已經(jīng)滿足最大迭代次數(shù),根據(jù)粒子群的最優(yōu)位置得到最優(yōu)的wi和bi。

        7) 極限學(xué)習(xí)機(jī)根據(jù)最優(yōu)wi和bi建立檔案信息管理成本預(yù)測模型。檔案信息管理成本預(yù)測流程見圖1。

        3? 大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測實例分析

        3.1? 樣本數(shù)據(jù)及預(yù)處理

        為了分析大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測效果,選擇多個檔案信息管理成本作為研究,將它們組合成一個樣本集合,具體如圖2所示。選擇BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸的檔案信息管理成本預(yù)測模型進(jìn)行對比實驗。

        3.2 檔案信息管理成本預(yù)測精度比較

        采用3種模型對圖3前100個檔案信息管理成本的樣本數(shù)據(jù)進(jìn)行建模,后面100個數(shù)據(jù)進(jìn)行測試,均進(jìn)行5次仿真實驗,統(tǒng)計每一次檔案信息管理成本預(yù)測精度,結(jié)果如圖3所示。對圖3的檔案信息管理成本預(yù)測精度進(jìn)行比較可以發(fā)現(xiàn),本文模型的檔案信息管理成本預(yù)測精度要明顯高于BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸,減少了檔案信息管理成本預(yù)測誤差。這主要是因為引入了大數(shù)據(jù)分析技術(shù)(極限學(xué)習(xí)機(jī))得到更優(yōu)的檔案信息管理成本預(yù)測模型,可以反映檔案信息管理成本變化特點。

        3.3 檔案信息管理成本的建模效率比較

        統(tǒng)計3種模型的檔案信息管理預(yù)測的建模時間,包括訓(xùn)練時間和測試時間,結(jié)果如表2所示。從表2可以發(fā)現(xiàn),3種模型的檔案信息管理測試時間相差不大,訓(xùn)練時間相差大。其中多元線性回歸的訓(xùn)練時間最少,其次為本文模型,最多的為BP神經(jīng)網(wǎng)絡(luò);而多元線性回歸預(yù)測誤差完全不能滿足實際應(yīng)用要求。因此,本文模型的檔案信息管理成本預(yù)測綜合性能更優(yōu)。

        表2? 檔案信息管理成本預(yù)測的建模時間對比? s? ? ? ? ?[模型 訓(xùn)練時間 測試時間 本文 7.48 1.710 BP神經(jīng)網(wǎng)絡(luò) 18.224 1.850 多元線性回歸 6.608 1.458 ]

        4? 結(jié)? 語

        為了提高檔案信息管理成本預(yù)測精度,本文設(shè)計基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測模型,測試結(jié)果表明,所設(shè)計模型獲得了高精度的檔案信息管理成本預(yù)測結(jié)果,且檔案信息管理成本預(yù)測效果要優(yōu)于其他模型,是一種速度快、精度高的檔案信息管理成本預(yù)測模型。

        參考文獻(xiàn)

        [1] 張倩.區(qū)塊鏈技術(shù)對高校檔案信息管理方式創(chuàng)新的可行性探究[J].檔案與建設(shè),2017,40(12):21?24.

        [2] 劉利.論檔案信息管理平臺在著作權(quán)集體管理組織中的應(yīng)用[J].浙江檔案,2013,24(8):26?29.

        [3] 丁任妹.關(guān)于構(gòu)建高校檔案信息管理系統(tǒng)的思考[J].西南民族大學(xué)學(xué)報(人文社科版),2003,22(8):360?361.

        [4] 喻念念.高校人事檔案信息管理系統(tǒng)模塊的設(shè)計與實現(xiàn)[J].山西檔案,2015,9(6):64?66.

        [5] 崔海莉,張惠達(dá).云計算環(huán)境下檔案信息管理系統(tǒng)風(fēng)險分析[J].檔案學(xué)研究,2013,15(1):56?60.

        [6] 周勝利.美國陸軍檔案信息管理系統(tǒng)建設(shè)的原則與特點[J].檔案與建設(shè),2012(10):22?25.

        [7] 李殷青,王志星.基于WEB的高校學(xué)生檔案信息管理系統(tǒng)的設(shè)計開發(fā)[J].蘭臺世界,2008,22(10):15?16.

        [8] 許慧,張立銘.基于Web的圖書館檔案管理系統(tǒng)設(shè)計與實現(xiàn)[J].現(xiàn)代電子技術(shù),2016,39(16):48?51.

        [9] 張麗娜,夏慶利.高校人力資源管理的現(xiàn)實困境與對策:基于大數(shù)據(jù)思維下高校人事檔案信息化建設(shè)的探討[J].學(xué)術(shù)論壇,2016,39(4):157?161.

        [10] 楊加,李笑難,張揚,等.基于大數(shù)據(jù)分析的校園電子郵件異常行為檢測技術(shù)研究[J].通信學(xué)報,2018,39(1):116?123.

        [11] 王萬良,張兆娟,高楠,等.基于人工智能技術(shù)的大數(shù)據(jù)分析方法研究進(jìn)展[J].計算機(jī)集成制造系統(tǒng),2019,25(3):529?547.

        [12] 陳貴平,王子牛.基于大數(shù)據(jù)分析的用戶信息多重加密存儲技術(shù)[J].計算機(jī)科學(xué),2018,45(7):150?153.

        [13] 余英,朱正國,黃超,等.基于大數(shù)據(jù)分析的配電網(wǎng)絡(luò)故障趨勢判斷[J].電源技術(shù),2018,42(1):132?134.

        [14] 郭平,王可,羅阿理,等.大數(shù)據(jù)分析中的計算智能研究現(xiàn)狀與展望[J].軟件學(xué)報,2015,26(11):3010?3025.

        [15] 張林林,胡熊偉,李鵬,等.基于極限學(xué)習(xí)機(jī)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法[J].上海交通大學(xué)學(xué)報,2019,53(6):749?756.

        猜你喜歡
        系統(tǒng)測試仿真實驗大數(shù)據(jù)分析
        互聯(lián)網(wǎng)平臺下的智能信息管理系統(tǒng)設(shè)計
        開展體驗式教學(xué)創(chuàng)新研究 提高化學(xué)課堂有效性
        面向大數(shù)據(jù)遠(yuǎn)程開放實驗平臺構(gòu)建研究
        面向大數(shù)據(jù)分析的信息管理實踐教學(xué)體系構(gòu)建
        傳媒變局中的人口電視欄目困境與創(chuàng)新
        科技傳播(2016年19期)2016-12-27 14:35:21
        大數(shù)據(jù)分析的移動端在網(wǎng)絡(luò)課堂教學(xué)中的應(yīng)用
        對CALIS查收查引系統(tǒng)的測試和應(yīng)用效果評價
        基于多重視閾下的《電子控制技術(shù)》課程的教學(xué)探討
        考試周刊(2016年64期)2016-09-22 18:20:00
        基于ETAP的電氣設(shè)計仿真實驗
        微弱信號檢測裝置的設(shè)計
        亚洲一区二区欧美色妞影院| 亚洲女同一区二区| 亚洲精品美女久久久久99| 女同亚洲女同精品| 国产精品一区二区久久精品蜜臀| 日本黄色3级一区二区| 女人被狂躁c到高潮| 亚欧AV无码乱码在线观看性色| 亚洲精品一区二区三区播放| 麻豆久久91精品国产| 中文字幕人妻第一区| 日本一区二区三区高清千人斩| 伊人色综合九久久天天蜜桃| 久草手机视频在线观看| 窝窝午夜看片| 2021国产精品视频| 一本久道在线视频播放| 亚洲av午夜精品无码专区| 国产在线不卡一区二区三区| 精品国产高清a毛片| 久久亚洲网站中文字幕| 国产一精品一av一免费| 中文字幕在线免费| 黄页国产精品一区二区免费| 国产亚洲精品久久午夜玫瑰园| 老师翘臀高潮流白浆| 日本精品免费一区二区三区| 亚洲熟女熟妇另类中文| 在线看无码的免费网站| 在线播放人成午夜免费视频| 精品国产乱码一区二区三区| 无套无码孕妇啪啪| 扒开双腿疯狂进出爽爽爽视频| 国产激情视频在线| 日本一二三四区在线观看| 一本一道久久综合久久| 91精品啪在线观看国产18| 好看的中文字幕中文在线| 精品人妻av区乱码| 色综合天天网| 国产av精品久久一区二区|