亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于稀疏表示的數(shù)據(jù)無失真壓縮模型構建

        2023-12-09 02:55:30孫壯
        電子設計工程 2023年23期
        關鍵詞:實驗模型

        孫壯

        (曲阜師范大學,山東濟寧 272000)

        在數(shù)據(jù)分析研究過程中,數(shù)據(jù)壓縮是一個基礎問題。一方面,數(shù)據(jù)壓縮能夠減小存儲空間,降低傳輸成本;另一方面,數(shù)據(jù)壓縮可以降低數(shù)據(jù)挖掘復雜度,并且可以保障數(shù)據(jù)內容的完整性與精確性。在常規(guī)的數(shù)據(jù)應用場景中,通信傳輸容量存在限制,對原始數(shù)據(jù)進行壓縮是保障有效傳輸?shù)年P鍵手段之一[1-2]。數(shù)據(jù)壓縮需要滿足下述需求:一是保留原始數(shù)據(jù)局部、全局特征,并可以通過某種手段還原原始數(shù)據(jù);二是數(shù)據(jù)壓縮運算不能夠過于繁瑣、復雜,保障壓縮、解壓與隨機訪問速度。就現(xiàn)有研究成果來看,已有數(shù)據(jù)壓縮模型由于應用方法自身缺陷,致使壓縮后數(shù)據(jù)容易出現(xiàn)失真現(xiàn)象,影響原始數(shù)據(jù)的精確性,故提出基于稀疏表示的數(shù)據(jù)無失真壓縮模型構建方法。

        1 數(shù)據(jù)無失真壓縮模型構建研究

        1.1 數(shù)據(jù)稀疏表示

        為了避免數(shù)據(jù)壓縮出現(xiàn)失真現(xiàn)象,基于超完備字典學習方法稀疏表示數(shù)據(jù),簡化數(shù)據(jù)的結構,為后續(xù)數(shù)據(jù)缺失填補奠定堅實的基礎。

        超完備字典學習方法主要應用于數(shù)據(jù)稀疏表示基函數(shù)獲取階段,通過系數(shù)與稀疏表示基函數(shù)使得原始數(shù)據(jù)特征不改變[3]。設定超完備字典為L∈Rm×n,數(shù)據(jù)樣本集合為,其對應的稀疏表示系數(shù)向量集合為。其中,m為數(shù)據(jù)樣本總數(shù)量,n為稀疏表示系數(shù)總數(shù)量,則超完備字典學習原理表達式為:

        以式(1)確定的超完備字典學習過程為基礎,制定超完備字典學習[4-5]具體步驟,具體如下所示:

        步驟1:超完備字典初始化?;诮o定的過完備字典或者數(shù)據(jù)樣本對字典進行初始化處理;

        步驟2:稀疏編碼。以步驟1 初始化后的字典L為基礎,基于正交匹配追蹤算法求解每一個數(shù)據(jù)樣本ai對應的稀疏系數(shù)向量bi。

        步驟3:超完備字典更新。以步驟2 計算的稀疏系數(shù)向量bi為依據(jù),對超完備字典L進行更新處理。依據(jù)上述步驟對L中所有原子進行逐列更新,從而產(chǎn)生新的超完備字典。

        步驟4:數(shù)據(jù)稀疏表示。將采集的數(shù)據(jù)y輸入至更新后的超完備字典中,獲取稀疏系數(shù)[6]向量{b1,b2,…,bi,…,bn},則數(shù)據(jù)稀疏表示為:

        根據(jù)上述過程完成數(shù)據(jù)的稀疏表示,并制定超完備字典的更新方式,以此來保障稀疏系數(shù)向量獲取的精準度,為最終數(shù)據(jù)壓縮的實現(xiàn)提供便利。

        1.2 數(shù)據(jù)聚類處理

        以稀疏表示后的數(shù)據(jù)為基礎,計算數(shù)據(jù)之間的相似度,應用譜聚類算法[7-8]聚類數(shù)據(jù),以此降低數(shù)據(jù)壓縮的運算量。

        采用自身乘以自身轉置的方式,將數(shù)據(jù)稀疏系數(shù)向量轉化為n×n方陣,以此為基礎,計算任意兩個數(shù)據(jù)yi與yj之間的相似度函數(shù),表達式為:

        式中,ηij為數(shù)據(jù)yi與yj之間的相似度函數(shù);為稀疏系數(shù)方陣的相似權重。

        以譜聚類算法為手段,獲取ηij對應的對角矩陣U與拉普拉斯矩陣V[9-10],對拉普拉斯矩陣V進行求解,獲取多個特征向量,并對其進行降序排列,通過標準化處理,獲得向量S=[s1,s2,…,sk],sk代表第k個拉普拉斯矩陣V特征向量[11-12]。以向量S的行向量si為聚類中心,以數(shù)據(jù)與聚類中心si之間的歐氏距離為依據(jù),劃分數(shù)據(jù)類別,具體規(guī)則如下式所示:

        式中,dij為聚類中心si與數(shù)據(jù)yj的歐氏距離;γ′為歐氏距離的輔助計算參數(shù);ε0為誤差項;d*為聚類歐氏距離閾值。當dij≤d*時,將數(shù)據(jù)歸到ci類;當dij>d*時,將數(shù)據(jù)歸到其他類。

        依據(jù)上述規(guī)則遍歷全部數(shù)據(jù),直至聚類結束為止,獲得數(shù)據(jù)聚類結果為{c1,c2,…,cp},為最終的數(shù)據(jù)壓縮提供依據(jù)。

        1.3 數(shù)據(jù)缺失填補

        在數(shù)據(jù)稀疏表示與聚類處理過程中,容易出現(xiàn)數(shù)據(jù)丟失現(xiàn)象,造成數(shù)據(jù)缺失,影響數(shù)據(jù)的最終壓縮與應用。因此,此研究應用SoftImpute 算法[13]填補缺失數(shù)據(jù),為后續(xù)無失真壓縮的實現(xiàn)做好準備。

        數(shù)據(jù)缺失填補程序如圖1 所示。

        如圖1 所示,采用Lasso 優(yōu)化求解來估計缺失數(shù)據(jù),表達式為:

        將式(5)估計的缺失數(shù)據(jù)填補到數(shù)據(jù)缺失位置,即可完成數(shù)據(jù)的缺失填補,為數(shù)據(jù)的完整性提供保障。

        1.4 數(shù)據(jù)無失真壓縮

        以缺失填補后的數(shù)據(jù)聚類集合C={c1,c2,…,cp}為基礎,應用k-means 算法[16]對數(shù)據(jù)進行無失真壓縮,為數(shù)據(jù)的應用提供便利。

        基于PredZip 算法的數(shù)據(jù)無失真壓縮框架如圖2所示。

        圖2 數(shù)據(jù)無失真壓縮框架圖

        數(shù)據(jù)無失真壓縮主要劃分為兩個階段,分別為算術編碼階段與概率預測階段。對數(shù)據(jù)進行獨立編碼,編碼后數(shù)據(jù)向量只有一個維度的值為1,其余值均為0,例如00000001、01000000 等。概率預測階段主要是對數(shù)據(jù)概率分布數(shù)值進行預測,以此來保障壓縮數(shù)據(jù)的準確性。

        上述過程實現(xiàn)了數(shù)據(jù)的無失真壓縮,節(jié)省了存儲空間,為管理人員提供更簡便的數(shù)據(jù)支撐。

        2 實驗與結果分析

        選取基于分布式壓縮感知和邊緣計算的配電網(wǎng)電能質量數(shù)據(jù)壓縮存儲方法與基于變形場測量數(shù)據(jù)主元壓縮的模型參量反求方法作為對比模型,設計數(shù)據(jù)無失真壓縮對比實驗,以此來驗證構建模型數(shù)據(jù)壓縮性能。

        2.1 實驗數(shù)據(jù)準備

        選取某公司財務管理系統(tǒng)財務數(shù)據(jù)作為實驗對象,由于財務數(shù)據(jù)體量較大,若直接對其進行應用,會造成實驗過程較長,運算量過大等缺陷,也會導致實驗結論的偏差。因此,在公司財務管理系統(tǒng)中隨機選取1 100 MB 財務數(shù)據(jù)作為實驗數(shù)據(jù),將其隨機劃分為10 個實驗組別,為后續(xù)實驗的進行提供便利。實驗組別如表1 所示。

        表1 實驗組別

        如表1 所示,劃分的10 個實驗組別中,財務數(shù)據(jù)量與財務數(shù)據(jù)類別具有較大的差別,表明每個組別的實驗工況存在一定的差異,符合數(shù)據(jù)壓縮模型應用性能測試需求。

        2.2 評價指標選取

        為了直觀顯示構建模型的應用性能,選取壓縮增益、壓縮比與壓縮失真率作為評價指標進行測試。常規(guī)情況下,壓縮增益數(shù)值越大,壓縮比與壓縮失真率數(shù)值越小,表明數(shù)據(jù)壓縮性能越好;反之,壓縮增益數(shù)值越小,壓縮比與壓縮失真率數(shù)值越大,表明數(shù)據(jù)壓縮性能越差。

        2.3 實驗結果分析

        以上述準備的實驗數(shù)據(jù)選取的評價指標為基礎,進行財務數(shù)據(jù)壓縮實驗,記錄實驗數(shù)據(jù),計算評價指標數(shù)值,具體如圖3 所示。

        圖3 評價指標數(shù)據(jù)圖

        如圖3(a)數(shù)據(jù)所示,相較于兩種對比模型,應用構建模型獲得的財務數(shù)據(jù)壓縮增益數(shù)值更大,最大值為18.8;如圖3(b)數(shù)據(jù)所示,相較于兩種對比模型,應用構建模型獲得的財務數(shù)據(jù)壓縮比數(shù)值更小,最小值為0.1;如圖3(c)數(shù)據(jù)所示,相較于兩種對比模型,應用構建模型獲得的財務數(shù)據(jù)壓縮失真率數(shù)值更小,最小值為0.5%,充分證實了構建模型數(shù)據(jù)壓縮性能更佳。

        3 結束語

        財務數(shù)據(jù)是企業(yè)運營管理的主要依據(jù),也是重要決策制定的關鍵因素。但是,隨著信息化水平的提升,企業(yè)財務數(shù)據(jù)數(shù)量呈現(xiàn)暴增趨勢,為財務數(shù)據(jù)存儲、應用帶來了極大的挑戰(zhàn)。很多企業(yè)由于存儲空間不足,刪除較為久遠的財務數(shù)據(jù),待需要時無從取證。由此可見,如何對財務數(shù)據(jù)進行無失真壓縮處理是保障企業(yè)可持續(xù)發(fā)展的關鍵手段,故提出基于稀疏表示的數(shù)據(jù)無失真壓縮模型構建研究。實驗數(shù)據(jù)表明,構建模型大幅度提升了數(shù)據(jù)壓縮增益,降低了數(shù)據(jù)壓縮比與壓縮失真率,能夠為財務數(shù)據(jù)處理提供更有效的模型支撐,也為相關研究提供一定的借鑒。

        猜你喜歡
        實驗模型
        一半模型
        記一次有趣的實驗
        微型實驗里看“燃燒”
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        做個怪怪長實驗
        3D打印中的模型分割與打包
        NO與NO2相互轉化實驗的改進
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        内射中出日韩无国产剧情| 免费无码av片在线观看网址| 男女野外做爰电影免费| 久久麻豆精品国产99国产精| 在线观看亚洲AV日韩A∨| 精品日本韩国一区二区三区| 国产激情自拍在线视频| 无码字幕av一区二区三区| 亚洲人成网站免费播放| 欧洲亚洲视频免费| 国产一区不卡视频在线| 国产91传媒一区二区三区| 国产激情无码视频在线播放性色| 欧美熟妇色ⅹxxx欧美妇| 欧美老熟妇又粗又大| 久久久精品国产亚洲av网| 亚洲中文字幕在线一区| 亚洲av麻豆aⅴ无码电影| 国产一级免费黄片无码AV| 亚洲日本国产一区二区三区| 国产在线无码精品无码| 久久香蕉国产线看观看精品yw | 国产精品农村妇女一区二区三区| 在线观看的a站免费完整版| 日本在线精品一区二区三区| 亚洲av无码专区在线观看成人| 欧美交换配乱吟粗大25p| 亚洲欧美国产日韩天堂在线视 | 丝袜人妻中文字幕首页| 亚洲av无码日韩av无码网站冲| 精品欧洲av无码一区二区| 2022Av天堂在线无码| 中国精品久久久久国产| 午夜福利视频一区二区二区| 黑人上司粗大拔不出来电影| 精品熟女少妇av免费观看| 中文字幕亚洲区第一页| 男女主共患难日久生情的古言| 亚洲日韩一区二区三区| 91成人午夜性a一级毛片| 偷柏自拍亚洲综合在线|