李可
河南大學(xué)軟件學(xué)院
大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望
李可
河南大學(xué)軟件學(xué)院
大數(shù)據(jù)有很多優(yōu)點,如規(guī)模比較大,種類多速度比較快,有很大的價值。大數(shù)據(jù)通過利用數(shù)據(jù)分析的方式,在數(shù)據(jù)中找到可利用的信息,不斷為用戶提供幫助,實現(xiàn)資自身的價值。本文主要介紹的內(nèi)容是大數(shù)據(jù)的分析方式和常用的分析方式,又分析了現(xiàn)階段大數(shù)據(jù)的研究現(xiàn)狀,并對未來的發(fā)展方向進(jìn)行了展望。
大數(shù)據(jù);應(yīng)用現(xiàn)狀;展望
隨著經(jīng)濟(jì)的發(fā)展和時代的進(jìn)步,許多領(lǐng)域中的數(shù)據(jù)都出現(xiàn)了增長的趨勢,因此就出現(xiàn)了大數(shù)據(jù)這個詞匯。何為大數(shù)據(jù)呢,指的是大量的數(shù)據(jù)集合,其中,有許多非結(jié)構(gòu)化的數(shù)據(jù),因此,需要進(jìn)行大量的分析,對其中的不顯性價值進(jìn)行挖掘和利用。隨著大數(shù)據(jù)時代的到來,在機(jī)遇出現(xiàn)的同時也面臨一定的挑戰(zhàn),各個領(lǐng)域都對大數(shù)據(jù)進(jìn)行了研究。
1.1 大數(shù)據(jù)管理
大數(shù)據(jù)的出現(xiàn)以及廣泛的應(yīng)用在各個領(lǐng)域,對傳統(tǒng)的數(shù)據(jù)造成了一定的威脅和挑戰(zhàn)?,F(xiàn)階段,對大數(shù)據(jù)進(jìn)行管理的過程中,其研究的方向有下面的幾個方面:
第一,大數(shù)據(jù)的數(shù)據(jù)互和互聯(lián)網(wǎng)的應(yīng)用。
第二,對移動數(shù)據(jù)等進(jìn)行的管理。
第三,一些社交網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行管理。
1.2 大數(shù)據(jù)搜集、挖掘和分析
在進(jìn)行大數(shù)據(jù)的建設(shè)時,有大量的數(shù)據(jù)信息需要了解,同時對大量的數(shù)據(jù)進(jìn)行及時有效的處理是研究的重點內(nèi)容。在對大數(shù)據(jù)進(jìn)行收集、整理的過程中,可以使用的方式有很多,如進(jìn)行分布式的搜索、社交網(wǎng)絡(luò)的模型進(jìn)行搜索和挖掘、對大數(shù)據(jù)進(jìn)行分析和挖掘等。通過這些方式的使用,可以將收集來的數(shù)據(jù)進(jìn)行整理,之后得到很好的利用。
1.3 大數(shù)據(jù)的集成
在數(shù)據(jù)應(yīng)用的過程中,個體的數(shù)據(jù)所產(chǎn)生的價值比較小,而將很多的數(shù)據(jù)進(jìn)行集合之后所產(chǎn)生的價值是非常大的。所以,將數(shù)據(jù)進(jìn)行有效的整合是比較大的問題,這個問題需要進(jìn)行解決。將不同來源的數(shù)據(jù)進(jìn)行整合的過程就是集成,同時在集成的過程中可能出現(xiàn)一定的問題,如無用的數(shù)據(jù)量比較大。在數(shù)據(jù)收集完成之后,經(jīng)過一段時間的積累可能會發(fā)生改變,這個改變的過程被稱為世系,在大數(shù)據(jù)的歷史背景之下,世系不再是單獨的數(shù)據(jù)集合,里面包含不同的數(shù)據(jù)集合,因此,如何很好的實現(xiàn)世系信息的整合是比較重要的問題。
1.4 大數(shù)據(jù)的應(yīng)用
在中國,因為大數(shù)據(jù)的應(yīng)用比較晚,屬于起步的階段,因此在應(yīng)用的過程中,對大數(shù)據(jù)的使用模式和應(yīng)該進(jìn)行不斷的探索,對新的和高效的模式進(jìn)行不斷的應(yīng)用,如果這樣的話,能夠使大數(shù)據(jù)在更多的領(lǐng)域中使用。
2.1 大數(shù)據(jù)出現(xiàn)規(guī)模大、種類多和結(jié)構(gòu)復(fù)雜的現(xiàn)象
雖然中國的大數(shù)據(jù)起步比較晚,但是發(fā)展的比較快速,原來的數(shù)據(jù)技術(shù)已經(jīng)不能跟上時代發(fā)展的需求?,F(xiàn)階段,數(shù)據(jù)出現(xiàn)的特點是規(guī)模比較大,種類比較多,同時結(jié)構(gòu)比較復(fù)雜,因此,為了更好的適應(yīng)發(fā)展的模式,對一些研究的方式應(yīng)該進(jìn)行適當(dāng)?shù)母淖兒透隆T谒械难芯砍晒校雀璧臄?shù)據(jù)庫是比較成功的一種,尤其是谷歌中的Spanner。我們可以知道,在未來的發(fā)展中,應(yīng)該研究大數(shù)據(jù)庫的存儲方式,實現(xiàn)分布式數(shù)據(jù)庫的更好的發(fā)展,在進(jìn)行存儲的過程中,為了使操作更加高效,應(yīng)該使用SQL語法。
2.2 數(shù)據(jù)的資源化
在進(jìn)行數(shù)據(jù)的分析中,會出現(xiàn)大量的數(shù)據(jù)信息,在信息中包含很多有用的價值,因此,對大數(shù)據(jù)的掌握非常的重要,對其進(jìn)行了掌握就說明對資源進(jìn)行了掌握。價值鏈存在在大數(shù)據(jù)中,如果從整個角度分析的話,可以說數(shù)據(jù)中的價值來源于數(shù)據(jù)的本身、技術(shù)和思維,其中核心內(nèi)容是數(shù)據(jù)資源,如果不考慮技術(shù)和思維的時候,數(shù)據(jù)基本沒有價值。另外,不同的數(shù)據(jù)進(jìn)行集合,創(chuàng)造的價值會更大。
2.3 促進(jìn)科技的交叉融合
大數(shù)據(jù)在不斷的發(fā)展,和相關(guān)的技術(shù)實現(xiàn)了融合,如云計算和互聯(lián)網(wǎng)技術(shù),另外,學(xué)科之間進(jìn)行了有效的融合。信息技術(shù)的發(fā)展為大數(shù)據(jù)提供和更廣闊的空間,在對大數(shù)據(jù)進(jìn)行探索的過程中,應(yīng)該將信息技術(shù)作為基礎(chǔ)。另外,在企業(yè)進(jìn)行決策的過程中,大數(shù)據(jù)的作用使很明顯的,影響企業(yè)的某些決策,如管理方面的額決策。大數(shù)據(jù)在不斷的發(fā)展,在很多的領(lǐng)域都得到了廣泛的應(yīng)用,因此需要對人才進(jìn)行培養(yǎng)。
2.4 實現(xiàn)以人為本
在科技發(fā)展的過程中,人力的作用是很重要的,在一定的情況下,人類的思維促進(jìn)了科技的進(jìn)步和發(fā)展。所以,在大數(shù)據(jù)的時代背景下,經(jīng)過對數(shù)據(jù)的分析忠厚,能夠給人類帶來正確的決策,但是需要注意以下方面:不能將數(shù)據(jù)的分析來代替人腦的作用。在數(shù)據(jù)應(yīng)用的過程中,人類的思維很重要,起到推動的作用。近幾年,網(wǎng)絡(luò)技術(shù)在不斷的興起,同時遙感技術(shù)在不斷的發(fā)展,在大數(shù)據(jù)發(fā)展中,人類的角色也發(fā)生了一定程度的改變,人類在扮演使用者和消費者的同時又是生產(chǎn)者。因此,大數(shù)據(jù)和人類之間的關(guān)系會越來越密切,共同推動社會的發(fā)展。
2.5 實現(xiàn)可視化
在計算機(jī)和人進(jìn)行交互作用的時候,應(yīng)該遵循的一條原則就是所見所得,如對文本和圖像編輯器的觀察。未來的大數(shù)據(jù)發(fā)展應(yīng)該實現(xiàn)可視化。在一定程度上,大數(shù)據(jù)是比較混亂的,如果在沒有分析的情況下使用時不行的,這樣的話是不能發(fā)揮作用,對數(shù)據(jù)進(jìn)行分析之后才能使用,這樣才能幫助人們進(jìn)行正確的決策。對大數(shù)據(jù)進(jìn)行有效的分析之后,將有效的結(jié)果輸送給使用者,不僅有利于使用者的接受,而且還能提高工作的效率?,F(xiàn)今,數(shù)據(jù)分析的結(jié)果有多種,有圖表型和曲線型等,為未來會有更多的形式出現(xiàn)。
[1]王珊,王會舉,覃雄派等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機(jī)學(xué)報,2011,34(10):1741-1752
[2]涂新莉,劉波,林偉偉.大數(shù)據(jù)研究綜述[J].計算機(jī)應(yīng)用研究, 2014,31(6)1612-1616