高 垣,佀 潔
(西北大學現(xiàn)代教育中心,西安 710127)
大數(shù)據(jù)概念名字第一次出現(xiàn)是在麥肯錫研究院的一篇學術論文里,文章對大數(shù)據(jù)做出了準確的定義,并指出大數(shù)據(jù)是未來的數(shù)據(jù)處理發(fā)展趨勢,也會成為未來時代的標簽。大數(shù)據(jù)技術將對人們的工作生活產(chǎn)生深淵影響,會為許多行業(yè)提供便利和發(fā)展空間。據(jù)相關統(tǒng)計資料數(shù)據(jù)表明,自2011年至今在我國范圍內(nèi)信息數(shù)據(jù)總量成倍增長,截止到2017年我國范圍內(nèi)信息數(shù)據(jù)量增加了1.8zb,平均每個人都有超過200gb的信息資源。由此可見數(shù)據(jù)的海量增長是這個時代的標簽。大數(shù)據(jù)時代也由此開始。
大數(shù)據(jù)到來以后,數(shù)據(jù)量飛速增長同時也帶來了信息檢索困難、效率底下等諸多數(shù)據(jù)處理難題,數(shù)據(jù)挖掘技術由此而生。經(jīng)過長期的發(fā)展,數(shù)據(jù)挖掘技術已經(jīng)較為完善、成熟。形成規(guī)范的理論體系和操作方法,發(fā)生了質的改變。我國對數(shù)據(jù)挖掘的研究起步較晚,且想通過提高數(shù)據(jù)挖掘的技術能力來促進人工智能的發(fā)展,因此我國對數(shù)據(jù)挖掘的技術深度要求較高。
大數(shù)據(jù)在我國有較廣的應用范圍,涵蓋各行各業(yè)諸如:醫(yī)療、企業(yè)管理、旅游、電子商務等等領域都得到餓了廣泛的應用,且對行業(yè)提升較大,實用度高。
大數(shù)據(jù)在醫(yī)療領域的應用主要是對醫(yī)療信息進行合規(guī)管理,提高醫(yī)療服務質量??梢越㈦娮硬±?、人醫(yī)療檔案、醫(yī)保大數(shù)據(jù)、病例挖掘等先進的基于大數(shù)據(jù)技術的信息管理模式。太高醫(yī)療行業(yè)管理規(guī)范化和智能化,例如:建立病例挖掘數(shù)據(jù)庫可以對疾病發(fā)生時間、患者年齡、患者職業(yè)和生活習慣等數(shù)據(jù)做出有效統(tǒng)計,尋找發(fā)病規(guī)律和治療方案,為類似病例治療提供數(shù)據(jù)支持。
在旅游行業(yè)可以通過大數(shù)據(jù)技術,對旅游涉及的資源數(shù)據(jù)如:景點相關信息、餐飲住宿、購物交通等進行有效整合,形成科學完整的旅游資源數(shù)據(jù)庫。并對每年不同月份旅游景點的游客人數(shù)、消費情況、旅游評價得進行綜合整體和分析,旅游企業(yè)可以根據(jù)以上兩個數(shù)據(jù)庫提供的完善科學的數(shù)據(jù)信息為客戶推薦最佳的旅游時間和路線,也可以為企業(yè)營銷決策提供數(shù)據(jù)支持。
電子商務平臺在我國發(fā)展迅速,十年間涌現(xiàn)出多家優(yōu)秀的電子商務企業(yè)如淘寶、天貓、京東、國美等等。隨著電子商務發(fā)展,電商網(wǎng)站的功能和管理提越來越趨于完善,用戶可以在成千上萬的產(chǎn)品中準確根據(jù)自己實際購買意向準確的定位產(chǎn)品個體,并具有客觀成熟的評價體系和售后體系,用戶購物體驗和滿意度越來越高,這一切都源于大數(shù)據(jù)技術的數(shù)據(jù)處理支持。
在大數(shù)據(jù)時代,人們需要更科學完善的數(shù)據(jù)提取方法,需要在海量數(shù)據(jù)中高效準確的提出目標信息,這就要求數(shù)據(jù)挖掘技術支持。數(shù)據(jù)挖掘可以根據(jù)用戶的實際信息獲取需求,制定搜索范圍和結構框架。如在醫(yī)療檔案管理中,現(xiàn)代數(shù)據(jù)挖掘技術可以像用戶提供文檔分類、語音識別、視頻搜索等多種數(shù)據(jù)定位模式。同時數(shù)據(jù)挖掘技術可一實現(xiàn)信息資源的分類管理,通過建立對應資源分類的子數(shù)據(jù)庫,進一步降低數(shù)據(jù)搜索難度,為人們的數(shù)據(jù)尋找需求提供了有效的幫助。
支持向量機是基于統(tǒng)計學數(shù)據(jù)管理理論通過計算機信息處理手段完成的數(shù)據(jù)挖掘技術。采用結構風險最小化的管理理念。針對非線性、小樣本、高緯空間大數(shù)據(jù)挖掘的數(shù)據(jù)提取工作有著良好的表現(xiàn)。它通過利用樣本信息特征,在數(shù)據(jù)庫中定向搜索同類信息,發(fā)掘數(shù)據(jù)庫中隱藏的有價值信息,為用戶提供對應的數(shù)據(jù)搜索服務,支持向量技術與其他算法兼容性高可以相結合,逐漸應用到火炮控制、雷達掃描、地質勘探等非線性大數(shù)據(jù)挖掘復雜場景。
神經(jīng)網(wǎng)絡可以對訓練數(shù)據(jù)進行自行組織、自適應的學習過程,并且能得到最具有典型特征的樣本和區(qū)分數(shù)據(jù)的能力。以便根據(jù)數(shù)據(jù)獲取需求,獲得對應價值的數(shù)據(jù)信息。并且神經(jīng)網(wǎng)絡數(shù)據(jù)挖掘技術可以對搜索的數(shù)據(jù)信息進行存儲、處理以及糾錯,都可以通過訓練學習時調整不同的申請網(wǎng)絡參數(shù)權值進行,具有較強的外界環(huán)境適應變換能力,同時具備非常強的抗干擾能力。神經(jīng)網(wǎng)絡數(shù)據(jù)挖掘技術在醫(yī)療影響、機器人、以及工業(yè)機器自動化等領域受到了廣泛的應用。
大數(shù)據(jù)已經(jīng)在現(xiàn)代信息社會得到了廣泛的應用,為人們提供醫(yī)療、購物、旅游和學習等決策支持,提供更加完善的、豐富的信息服務。數(shù)據(jù)挖掘技術可以有效提高數(shù)據(jù)檢索效率,提高數(shù)據(jù)的微觀和宏觀分析能力,實現(xiàn)智能推理指導人們在實際生活,具有重要的作用。
[1] 倪光南.大數(shù)據(jù)的發(fā)展及應用[J].信息技術與標準化,2013,09:114-115.