鄒小彤
摘 要
隨著科學技術的發(fā)展,人們迎來了信息化的時代,網(wǎng)絡已經成為了我們生活中必不可少的物質之一,大數(shù)據(jù)也成為了現(xiàn)代社會中的主要統(tǒng)計手段。傳統(tǒng)的計算模式不僅相對復雜,并且準確率不高,使用效率也極其的低下。由此,出現(xiàn)了基于MATLAB軟件下的網(wǎng)絡數(shù)據(jù)技術,它以高速化、關聯(lián)化的優(yōu)勢成為人們眼中的焦點。本文針對傳統(tǒng)網(wǎng)絡軟件模式中出現(xiàn)的問題,對基于MATLAB大數(shù)據(jù)技術進行探討。
【關鍵詞】MALAB軟件 網(wǎng)絡媒體 大數(shù)據(jù) 技術研究
隨著人們需求的不斷增加,傳統(tǒng)技術中的統(tǒng)計方式已經逐漸被大數(shù)據(jù)所取代,成為信息搜集與設置的主要形式。大數(shù)據(jù)也被稱為“巨量資料”,它所涉及到的管理模式是無法用傳統(tǒng)的流程來分析的,它在生產生活中也有了越來越重要的作用。
1 傳統(tǒng)數(shù)據(jù)面臨的挑戰(zhàn)
在信息時代的推動下,用戶在網(wǎng)上平臺都留下了大量的資源,這些資源的種類不一,分布也非?;靵y。所以,急需出現(xiàn)一種先進的管理模式對用戶資源進行劃分。人們要求的不僅是對數(shù)據(jù)模式的統(tǒng)計,它更多的是在統(tǒng)一的平臺上對此進行分析與管理。但顯然傳統(tǒng)模式已經不能達到這種要求。簡而言之,就是用戶想要在信息庫中找到符合自己要求的資源是非常困難的。另一方面,許多用戶也沒有一個有效的平臺去表達自己的要求與觀點,導致信息提供者很難發(fā)現(xiàn)我們的需求所在。為了將這些問題解決,我們需要在網(wǎng)絡媒體大數(shù)據(jù)技術的發(fā)展下進行模型的構建。
在國內的網(wǎng)絡大數(shù)據(jù)處理方法有很多,但工具仍然沒有進行進一步的優(yōu)化。傳統(tǒng)的數(shù)據(jù)統(tǒng)計方式具有一定的片面性,它只是對一部分數(shù)字進行取樣,而不是將整個系統(tǒng)完全的覆蓋。另一方面,它只是依賴與當前的科學軟件進行設置,沒有對整體部分進行整合與監(jiān)督預測的功能。以上幾點就是傳統(tǒng)數(shù)據(jù)面臨的具體挑戰(zhàn),也是網(wǎng)絡媒體中大數(shù)據(jù)出現(xiàn)的必要性。
2 基于MATLAB軟件的網(wǎng)絡媒體中大數(shù)據(jù)技術研究
2.1 對數(shù)據(jù)進行聚類分析
數(shù)據(jù)聚類分析的形式就是網(wǎng)絡媒體中大數(shù)據(jù)技術的重要表現(xiàn)之一。如圖1所示,該圖是網(wǎng)絡媒體的大數(shù)據(jù)聚類分析結構示意圖。我們可以從圖1中看出,它的整個過程是非常合理并且有序的。首先,系統(tǒng)在內部會自動輸入運算的應用法則,在數(shù)據(jù)中心對應用模式進行讀取。接著,將各數(shù)據(jù)的生成點按照順序進行分類,在初始化進程中進行設置。當數(shù)據(jù)達到一定的數(shù)量時,系統(tǒng)會按照就近原則對它們進行劃分。劃分后的數(shù)值在計算類中心處進行管理。當整個過程全部執(zhí)行完畢后,判斷類中心是否有變化,最終根據(jù)整個過程的結果來對大數(shù)據(jù)進行核算。這樣的大數(shù)據(jù)統(tǒng)計方式不僅有效,并且在區(qū)域空間內可對網(wǎng)絡媒體平臺進行重組。當MATLAB軟件面對非結構化、零星化的數(shù)據(jù)時會進入高速運轉的狀態(tài)。首先,我們可以利用媒體下的網(wǎng)絡應用端口對數(shù)據(jù)進行收集,再經由MATLAB軟件對收集來的數(shù)據(jù)進行整理與重新組合。這樣在用戶查找信息的數(shù)據(jù)的時候就不會毫無頭緒,只要在網(wǎng)絡媒體平臺下進行搜索就完成了整個過程的關鍵部分。最為重要的是,此步驟為深度挖掘數(shù)據(jù)提供重要的依據(jù)。
2.2 大數(shù)據(jù)的深度挖掘
可想而知,大數(shù)據(jù)包的深度挖掘在網(wǎng)絡媒體中是非常重要的一個部分。深度挖掘的數(shù)據(jù)模式主要包括四大模塊。
2.2.1 數(shù)據(jù)的關聯(lián)分析
數(shù)據(jù)中如果有兩個或者兩個以上的數(shù)據(jù)存在著某種關系,這樣表現(xiàn)方式就可以稱為具有關聯(lián)性。關聯(lián)分析主要是在整個媒體網(wǎng)絡平臺上對各用戶的身份進行歸類,將集約系統(tǒng)化的成分分到一起,將獨立的模塊進行統(tǒng)計,找出關聯(lián)網(wǎng)中隱藏的聯(lián)系。另外,也可以將數(shù)據(jù)劃分為幾個模塊,將其中的關鍵模塊設為定量,其他的模塊隨著定量而進行變化。并且MATLAB軟件中有統(tǒng)計性質的工具箱,系統(tǒng)可以算出模塊之間的方差,在求和的基礎上尋找二者的關聯(lián)。
2.2.2 數(shù)據(jù)可視化
數(shù)據(jù)可視化是其中最為關鍵的一個部分。MATLAB軟件具有超強的可視功能,它可以通過系統(tǒng)將數(shù)據(jù)轉化為二維或者是三維圖形,操作者就可以清晰的在電腦中看到數(shù)據(jù)之間的變化規(guī)律。例如:企業(yè)想要對該產品的運營風險進行統(tǒng)計。MATLAB軟件就可以將各變量之間的比例關系表達出來,做出變動式的曲線風險評估圖。通過這樣的可視化成果,企業(yè)管理者可以更加直觀的明白此產品是否能夠迎合大眾的取向,是否有發(fā)展的空間,進而做出最正確的決定。
2.2.3 異常值檢測
在媒體網(wǎng)絡大數(shù)據(jù)技術的管理之下,海量信息的特征都會在MATLAB系統(tǒng)中進行顯示。我們可以從中清晰的看出哪些數(shù)值是具有典型規(guī)律的。在曲線的變化中,往往也會有一些波動非常大的圖像,這也正說明此數(shù)據(jù)具有差異性,會影響企業(yè)決策者做出正確的判斷。而MATLAB系統(tǒng)可以通過配平以及R平方指數(shù)下的運算法則求出標準數(shù)值,進而與各參數(shù)進行對比,使人們更好的理解其中的偏差。
3 結論
綜上所述,新媒體大數(shù)據(jù)技術下的MATLAB軟件是適合當前技術發(fā)展的新形勢,也將當前的信息化過程推向了一個至高點之中。我們可以依托此技術對整體部分進行整合與歸類,將數(shù)據(jù)下的規(guī)律挖掘出來,為企業(yè)管理者提供更好的決策依據(jù),充分發(fā)揮科技化的作用,為我國網(wǎng)絡新媒體的創(chuàng)新奠定良好基礎。
參考文獻
[1]劉怡,李慧君.傳播學視野中的大數(shù)據(jù)與新媒體發(fā)展[J].現(xiàn)代傳播,2013(01).
[2]曾凡斌.大數(shù)據(jù):一場管理革命[J].中國傳媒科技,2013(01).
[3]曾凡斌.大數(shù)據(jù)對媒體經營管理的影響及應對分析[J].產業(yè)論壇,2015.
[4]陳昌鳳,仇藥茜.移動化:媒介融合的新戰(zhàn)略[J].新聞與寫作,2011.
[5]張濤甫.大數(shù)據(jù)時代的出版困局及其突破[J].編輯學習,2013(02).
作者單位
同濟大學軟件學院 上海市 201804
電子技術與軟件工程2016年19期