閆 實,付 佳,劉占波,石 莉,石 丹
?
大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源多維評價研究
閆 實1,付 佳2*,劉占波1,石 莉1,石 丹2
(1. 牡丹江醫(yī)學院現(xiàn)代教育技術中心,黑龍江 牡丹江 157011;2. 牡丹江醫(yī)學院圖書館,黑龍江 牡丹江 157011)
針對網(wǎng)絡信息資源的日益復雜和快速的發(fā)展,本文利用大數(shù)據(jù)技術,在大數(shù)據(jù)環(huán)境下對網(wǎng)絡信息資源多維評價研究,分別對網(wǎng)絡信息資源的處理、網(wǎng)絡信息資源的多維度評價體系的建立以及大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源進行建設三個方面進行深入的研究和探討。
大數(shù)據(jù);網(wǎng)絡信息資源;多維評價
隨著信息通訊技術的不斷發(fā)展和各種智能終端的應用普及,人們在日常的工作、學習和生活中都通過利用計算機、手機以及其他的各種移動設備產(chǎn)生了大量的數(shù)據(jù),其規(guī)模和復雜程度超越了傳統(tǒng)技術手段所能處理的范圍。隨著互聯(lián)網(wǎng)以及社會經(jīng)濟的快速發(fā)展,網(wǎng)絡信息資源多維評價種類日益增加,并且各大酒店之間的競爭隨著經(jīng)濟的發(fā)展而日益激烈,使得網(wǎng)絡信息資源多維評價復雜和繁瑣,出現(xiàn)了很多新問題。但是現(xiàn)在隨著計算機網(wǎng)絡技術以及大數(shù)據(jù)技術的快速發(fā)展,各種領域的網(wǎng)絡信息資源多維評價也越加豐富,因此,將大數(shù)據(jù)技術和計算機網(wǎng)絡技術應用于網(wǎng)絡信息資源多維評價中。
數(shù)據(jù)的重要程度不亞于人力資本以及物質資產(chǎn),被認為是新時期的基礎生活資料與市場要素。近年來,傳統(tǒng)的信息資源管理技術已經(jīng)無法應對大數(shù)據(jù)時代的挑戰(zhàn)。大數(shù)據(jù)技術和其他大數(shù)據(jù)工具與設備的出現(xiàn),隨著計算機技術以及大數(shù)據(jù)技術的快速發(fā)展,大數(shù)據(jù)技術和云計算技術在國內外興起,并且大數(shù)據(jù)技術在各個應用領域取得許多的成果。大數(shù)據(jù)技術是未來國家信息化發(fā)展的重點方向之一。深化和拓展了企業(yè)商業(yè)智能和知識服務能力,形成了數(shù)據(jù)驅動的決策機制,提高了決策水平[1]。
之前被很多大公司把大數(shù)據(jù)納為自己特有的流行詞,然而近幾年,大數(shù)據(jù)已經(jīng)變成了一種驅動我們信息化技術發(fā)展的新動力[2]。大數(shù)據(jù)與大數(shù)據(jù)技術是相輔相成的,如果要對大數(shù)據(jù)進行處理,單臺計算機是不能對大數(shù)據(jù)進行處理或運算的,因此必須采用大數(shù)據(jù)分布式架構進行處理。此外還可利用大數(shù)據(jù)的業(yè)務量,在實際應用中更多的應用到大數(shù)據(jù)。在現(xiàn)階段,基于Hadoop突出的優(yōu)勢,各個大型基于互聯(lián)網(wǎng)運行的公司都在開發(fā)基于Hadoop架構的數(shù)據(jù)處理模式[3]。隨著互聯(lián)網(wǎng)日新月異的發(fā)展,今后還將會繼續(xù)開拓出新的業(yè)務方式,也就是說Hadoop這個數(shù)據(jù)處理架構會以更新、更完美的姿態(tài)被運用到其他領域。
大數(shù)據(jù)于2003年正式開啟開發(fā)和研究工作,美國的七所頂尖院校的研究人員共同提出了“大數(shù)據(jù)VGrADS和網(wǎng)格虛擬化”的項目[4],之后Amazon、Giftag、Saleforce.com以及IBM都使用大數(shù)據(jù)來提高自己在業(yè)界的競爭力。例如,Google以企業(yè)搜索、應用托管等形式向企業(yè)提供Google開放云,而Microsoft推出了Live Mesh這種網(wǎng)絡管理和數(shù)據(jù)存儲軟件來與Google競爭。在2006年Amazon推出了彈性計算云和簡單存儲服務,是建立在2004年Amazon提出了MechanicalTurk、簡單隊列服務等大數(shù)據(jù)服務雛形之上的[5]。在2008年,IBM提出了公有云和私有云的定義[6-7]。而Apple公司近年來也相繼推出iTunes服務以及MobileMe服務等,標志向大數(shù)據(jù)開始進軍。
與美國相比,國內的大數(shù)據(jù)發(fā)展較慢,但業(yè)內人士把大數(shù)據(jù)作為一個新機遇,紛紛開拓大數(shù)據(jù)的應用市場。首先是中國移動、中國電信以及中國聯(lián)通三大運營商都推出了自己的云產(chǎn)品,如中國移動的“大云”大數(shù)據(jù)基礎服務平臺、中國聯(lián)通的“互聯(lián)云”平臺以及中國電信的“e云”大數(shù)據(jù)平臺。并且許多大數(shù)據(jù)被開發(fā)商高度關注,使得大數(shù)據(jù)在國內外的研究都很主流。但是總體來說,大數(shù)據(jù)目前的研究正處于發(fā)展階段,仍有大量關鍵問題需要進行深入研究,主要是從解決內在的局限性發(fā)以及拓展大數(shù)據(jù)應用模式等角度出發(fā),圍繞可靠性、低成本等因素方面?,F(xiàn)如今,海量數(shù)據(jù)的來源隨著手機和手機中的應用越來越多,所以將大數(shù)據(jù)技術以及云架構技術應用到手機以及通信網(wǎng)絡應用中將會是一個很重要的方面。隨著新一代社交網(wǎng)絡、數(shù)字城市等大規(guī)?;ヂ?lián)網(wǎng)應用的迅猛發(fā)展。由于新一代具有、業(yè)務增長速度快、數(shù)據(jù)存儲量大等特點已快速的應用至生活的各個領域中[8]。如圖1所示為云架構計算是互聯(lián)網(wǎng)技術、分布式計算、大規(guī)模資源管理等技術的發(fā)展與融合。
圖1 云架構技術與相關技術的聯(lián)系
大數(shù)據(jù)與大數(shù)據(jù)技術是相輔相成的,如果要對大數(shù)據(jù)進行處理,單臺計算機是不能對大數(shù)據(jù)進行處理或運算的,因此必須采用大數(shù)據(jù)分布式架構進行處理。利用大數(shù)據(jù)的提供更方便的服務、更加迅速地處理大數(shù)據(jù)的豐富信息以及更強大計算能力;此外還可利用大數(shù)據(jù)的業(yè)務量,在實際應用中更多的應用到大數(shù)據(jù)。網(wǎng)絡信息資源對內部產(chǎn)生和外部反饋的大量數(shù)據(jù)信息僅僅是存儲下來,缺少信息的甄別、分類、整合和加工,很少利用信息進行管理決策,使得網(wǎng)絡信息資源多維度評價體系整合度非常低。網(wǎng)絡信息資源在大數(shù)據(jù)的背景下,將結構化和非結構化的方法融合,利用大數(shù)據(jù)分析、云計算技術以及挖掘技術實現(xiàn)信息資源的高效利用,從而建立網(wǎng)絡信息資源多維度評價體系[9]。
就目前大多數(shù)的企業(yè)而言,網(wǎng)絡信息資源多維度評價體系的建立仍然只是在表面,而其利用率很低,網(wǎng)絡信息資源多維度評價體系的核心目標就是確保網(wǎng)絡信息資源的有效利用,利用大數(shù)據(jù)分析、云計算技術以及挖掘技術實現(xiàn)信息資源的高效利用來建立網(wǎng)絡信息資源多維度評價體系,才能有序組織和管理結構復雜、大量、實時且潛在價值高的數(shù)據(jù)信息,才能使得網(wǎng)絡信息資源的評價體系有個正確決策,才能及時、準確地挖掘分析出海量數(shù)據(jù)信息的潛在價值,才能確保信息資源的有效利用[10]。
大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源建設的核心技術是依托企業(yè)主數(shù)據(jù)管理(MDM,Master Data Management),實現(xiàn)信息資源模式的統(tǒng)一,同時能夠進行強化數(shù)據(jù)標準化建設。網(wǎng)絡信息資源在大數(shù)據(jù)的背景下,將結構化和非結構化的方法融合。利用大數(shù)據(jù)分析、云計算技術以及挖掘技術實現(xiàn)信息資源的高效利用。通過總結多年企業(yè)信息化規(guī)劃經(jīng)驗,結合大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源建設的要求,總共將網(wǎng)絡信息資源建設的方法分為以下5個階段:
第一階段:大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的識別;
第二階段:大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的診斷;
第三階段:大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的規(guī)劃;
第四階段:大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的實施;
第五階段:大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的維護。
通過上述五個階段進行網(wǎng)絡信息資源的建設,將結構化和非結構化的方法融合,將超文本和超媒體等信息利用,進行大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源建設是十分有必要的。
網(wǎng)絡信息資源在大數(shù)據(jù)的背景下,將結構化和非結構化的方法融合,利用大數(shù)據(jù)分析、云計算技術以及挖掘技術實現(xiàn)信息資源的高效利用。針對網(wǎng)絡信息資源的日益復雜和快速的發(fā)展,本文利用大數(shù)據(jù)技術,在大數(shù)據(jù)環(huán)境下對網(wǎng)絡信息資源多維評價研究,分別對信息資源的處理、網(wǎng)絡信息資源的多維度評價體系的建立以及大數(shù)據(jù)環(huán)境下信息資源進行建設三個方面進行深入的研究和探討。
[1] 郭玲, 郭澤睿. 網(wǎng)絡教育在大數(shù)據(jù)影響下的發(fā)展策略及方法研究[J]. 中國教育信息化, 2017(13): 21-26.
[2] 趙星, 李石君, 余偉,等. 大數(shù)據(jù)環(huán)境下Web數(shù)據(jù)源質量評估方法研究[J]. 計算機工程, 2017, 43(2): 48-56.
[3] VERMA A, LLOR X, GOLDBERG D E, et al. Scaling genetic algorithms using mapreduce[A]. ISDA'09[C]. IEEE Computer Society, 2009. 13-18.
[4] 毛太田, 孫紅霞. 大數(shù)據(jù)環(huán)境下政府信息資源配置評價研究[C]// 中國管理科學學術年會. 2017.
[5] 黃雙穎. 大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源的管理與利用研究[J]. 圖書情報導刊, 2014(21): 102-104.
[6] 張斌, 馬費成. 大數(shù)據(jù)環(huán)境下數(shù)字信息資源服務創(chuàng)新[J]. 情報理論與實踐, 2014, 37(6): 28-33.
[7] GILLEN A, BROUSSARD F W, PERRY R, et al. Optimizing infra- structure: the relationship between it labor costs and best practices for managing the windows desktop[EB/OL]. http: //download.microsoft.com/download/a/4/4/a4474b0c-57d8- 41a2-afe6-32037fa93ea6/IDC_windesktop_IO_whitepaper.pdf 2007.
[8] MELL P, GRANCE T. The NIST Definition of Cloud Computing[R]. National Institute of Standards and Technology, 2011.
[9] 楊燕. 大數(shù)據(jù)環(huán)境下的信息處理技術分析[J]. 信息與電腦(理論版), 2018(12): 156-157.
[10] 饒啟聰, 許丹, 蔣海洪. 健康大數(shù)據(jù)智能采集與挖掘系統(tǒng)平臺的軟件架構實踐[J]. 軟件, 2017, 38(08): 200-203.
Research on Multidimensional Evaluation of Network Information Resources Under Big Data Environment
YAN Shi1, FU Jia2*, LIU Zhan-bo1, SHI Li1, SHI Dan2
(1. Modern Educational Technology Center, Mudanjiang Medical College, Mudanjiang, Heilongjiang 157011; 2. Mudanjiang Medical College Library, Mudanjiang, Heilongjiang 157011)
In view of increasingly complex and rapid development of network information resources, the article researches multi-dimensional evaluation of network information resources under big data environment with big data technology in depth, including three aspects of network information resources processing, establishment of multi-dimensional evaluation system of network information resources and network information resources construction under big data environment respectively.
Big data; Network information resources; Multi-dimensional evaluation
G203
A
10.3969/j.issn.1003-6970.2018.12.017
2017年度黑龍江省哲學社會科學研究規(guī)劃項目(項目編號:17TQE362)
閆實(1977-),男,副教授,研究方向:大數(shù)據(jù),計算機網(wǎng)絡安全;劉占波(1981-),男,副教授,研究方向:數(shù)據(jù)挖掘;石莉(1982-),女,講師,研究方向:大數(shù)據(jù);石丹(1981-),女,研究方向:數(shù)字圖書館。
付佳(1981-),女,副研究館員,研究方向:數(shù)字圖書館。
閆實,付佳,劉占波,等. 大數(shù)據(jù)環(huán)境下網(wǎng)絡信息資源多維評價研究[J]. 軟件,2018,39(12):74-76