王梓北京聯(lián)合大學生物化學工程學院
信息時代大數(shù)據(jù)應用的探索
王梓
北京聯(lián)合大學生物化學工程學院
隨著計算機技術(shù)的普及和發(fā)展,各行各業(yè)所使用的數(shù)據(jù)量愈來越大,數(shù)據(jù)的內(nèi)容更加復雜,而且還有數(shù)據(jù)保密和共享的需求,開放數(shù)據(jù)不僅是公開數(shù)據(jù),使得數(shù)據(jù)可以被重復使用,任意加工,而且數(shù)據(jù)還可能涉及到個人隱私等問題。數(shù)據(jù)開放與共享已經(jīng)成為一種大趨勢,互聯(lián)網(wǎng)將成為智能的數(shù)據(jù)網(wǎng)。
信息;大數(shù)據(jù);開放與共享
信息時代是農(nóng)業(yè)時代、工業(yè)時代之后出現(xiàn)的一個全新文明時代,在信息時代,信息資源已經(jīng)成為比人力資源和物質(zhì)資源更重要的資源,信息資源的收集、公開、利用以及整合已經(jīng)成為經(jīng)濟社會活動的樞紐,并對整個社會的政治、文化生活產(chǎn)生積極的影響。
在大多數(shù)情況信息和數(shù)據(jù)這兩個詞是可以互相替換的。但嚴格來說,數(shù)據(jù)和信息這兩個概念還是有著比較大的區(qū)別。信息是把數(shù)據(jù)放置到特定的條件下,對數(shù)字進行解釋并賦予意義,數(shù)據(jù)是將信息進行數(shù)字化記錄,其本身并無意義。比如:2.26是一個數(shù)據(jù),姚明的身高2.26米就是一個信息。但是,自從步入了信息時代之后,人們更加趨向把已經(jīng)存在計算機上的信息,包括音視頻多媒體資料統(tǒng)稱為數(shù)據(jù)。本文所說的大數(shù)據(jù)主要是指不能快速的利用普通軟件工具進行捕捉、處理和管理的海量數(shù)據(jù)集合,這是需要更加新型的計算模式才能具有更強的優(yōu)化能力和決策能力的海量多元化信息資產(chǎn)。
隨著計算機技術(shù)的普及和發(fā)展,各行各業(yè)所使用的數(shù)據(jù)量愈來越大,數(shù)據(jù)的內(nèi)容更加復雜,而且還有數(shù)據(jù)保密和共享的需求,開放數(shù)據(jù)不僅是公開數(shù)據(jù),使得數(shù)據(jù)可以被重復使用,任意加工,而且數(shù)據(jù)還可能涉及到個人隱私等問題。因此什么樣的數(shù)據(jù)能夠共享,什么樣的數(shù)據(jù)需要保密已經(jīng)成為目前亟待解決的問題。
能夠共享的數(shù)據(jù)應該是完整原始的、可讀取可處理的,所以數(shù)據(jù)公開的格式也非常重要。例如我們身邊經(jīng)常能接觸到的共享數(shù)據(jù)資源包括,通過手機通訊等渠道即時發(fā)布的節(jié)假日旅客出行情況,我們能夠提前預判交通擁堵的可能性,公眾便以此來決定出行的時間和方向,從而緩解假日出行帶來的交通擁堵問題。數(shù)據(jù)開放與共享已經(jīng)成為一種大趨勢,互聯(lián)網(wǎng)將成為智能的數(shù)據(jù)網(wǎng)。
目前信息時代的主要特點是創(chuàng)新。信息的存儲、處理、發(fā)布已經(jīng)不再是重點,基于信息的創(chuàng)新已經(jīng)成為主導。信息的高度個性化已成現(xiàn)實,隨著無線傳感器以及普適計算的深入“萬物皆聯(lián)網(wǎng)、無處不計算”逐漸成為現(xiàn)實。我們察覺到隨著大數(shù)據(jù)的應用給社會帶來了改變,軟件開源和數(shù)據(jù)開放催生了大眾的創(chuàng)新——從滴滴打車到共享單車,信息共享正在向普通人流動。目前數(shù)據(jù)已成為重要的資源,一旦信息數(shù)據(jù)自由開放,就意味著信息和每個人的距離是相等的,而且中間沒有損耗。數(shù)據(jù)的開放和流動是多方面多渠道的。在這個時代,社會的主體結(jié)構(gòu)將從“層級”轉(zhuǎn)向“網(wǎng)狀”,在網(wǎng)狀傳播的不斷沖擊下,個人的主體價值將得到空前地張揚,大數(shù)據(jù)催生一個更加開放、更加平等的網(wǎng)狀社會。
傳統(tǒng)的學校教育手段大都是一對多的講授,無法做到對每位學生的個性化教學。信息技術(shù)的變革給教育領(lǐng)域帶來的最直接的改變就是在線互動學習對傳統(tǒng)的教育機構(gòu)的沖擊。教育資源優(yōu)勢學??梢园驯拘4罅康脑诰€精品課程匯集成海量的數(shù)據(jù)公布在網(wǎng)絡平臺,通過計算統(tǒng)計廣大在線用戶的點擊數(shù)據(jù),從而不斷的淘汰和沉淀,最終會成為經(jīng)典的教育資源,這些課程數(shù)據(jù)作為寶貴的現(xiàn)實需求資源,可能會取代老師在課堂上的講授。
未來大部分教育工作者更多是扮演著教學組織者和引導者。學習者可以根據(jù)自身的特點和條件自主定制個性化課程表,合理的安排好業(yè)余時間進行在線學習。優(yōu)質(zhì)的教育資源將得到共享,廣大民眾將是這場變革最大受益者。大數(shù)據(jù)在教育領(lǐng)域的應用在不遠的將來還有可能對我國的整個教育體制產(chǎn)生深遠的影響。
信息時代大數(shù)據(jù)的迅猛發(fā)展給各行各業(yè)帶來了前所未有的機遇。教育行業(yè)利用自身學術(shù)優(yōu)勢搭建在線教育平臺之所以具有優(yōu)勢,是因為能夠通過在線平臺收集、分析、使用大量的數(shù)據(jù)。這類數(shù)據(jù)的規(guī)模是空前的,用戶通過身份驗證登錄在線學習平臺,從中挑選自身需要的各類課程,我們從中獲取的個人信息和用戶需等數(shù)據(jù)是及時的、海量的,真實有效的。這不僅僅是簡單的數(shù)據(jù),通過有效的算法提煉加工形成各種信息資源,我們可以通過用戶群體的年齡性別以及所學課程了解當前社會最熱門領(lǐng)域的人才需求,及時優(yōu)化教育資源配置,提高資源的利用率。還可以利用各類在線測試挑選出優(yōu)秀人才,使得優(yōu)質(zhì)的人力資源在相應的領(lǐng)域能夠最大限度地發(fā)揮自身價值。
信息時代大數(shù)據(jù)應用對各個行業(yè)產(chǎn)生的影響是巨大的。以用戶的在線學習成績等評價手段選拔行業(yè)所需人才只是大數(shù)據(jù)應用的冰山一角。隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)在不斷的積累,我們每個人在現(xiàn)實生活中的活動都會形成各類數(shù)據(jù)被完整的記錄下來,這種記錄可能通過身邊的手機通訊設備、公共監(jiān)控設備、共享資源系統(tǒng),匯集成完整的數(shù)據(jù)信息。這些數(shù)據(jù)信息看似雜亂無序,通過有效的整合提煉,可以形成非常有價值的信息資源。
信息時代,虛擬網(wǎng)絡的信息的真實可靠性相對較低。隨著現(xiàn)代應用平臺對身份驗證的要求不斷提高,采集信息的真實可靠性都有了質(zhì)的飛躍。這對社會科學的分析研究提供了精準的、可靠的、及時的數(shù)據(jù)資源。社科類研究再也不再需要設計各類調(diào)查問卷的形式收集特定研究對象的相關(guān)信息,而是通過已有的大數(shù)據(jù)資源,篩選、提煉從而得到比以往更加精準的分析結(jié)果。
信息時代大數(shù)據(jù)的應用對每個人的工作、生活都會產(chǎn)生影響,我國是一個人口大國,但不是一個數(shù)據(jù)大國,我國大數(shù)據(jù)技術(shù)發(fā)展相對不平衡,數(shù)據(jù)的收集渠道、處理手段還有需要加強和完善,不論是國家還是個人在收集數(shù)據(jù)的意識這方面都需要更加的規(guī)范。只有這樣才能使得我們在這個充滿數(shù)據(jù)的時代發(fā)揮人口大國優(yōu)勢,充分利用好大數(shù)據(jù)資源給我們的歷史機遇。
[1]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學出版社,2014.7
王梓(1983-),男,北京人,北京聯(lián)合大學生物化學工程學院,實驗師,大學本科,研究方向:計算機技術(shù)。