金濤偉++隋永博++曹旭
【摘 要】隨著醫(yī)療信息化進程水平的不斷提高,通過各類醫(yī)療管理系統(tǒng)、數據采集平臺逐漸形成了醫(yī)療信息的“大數據”,合理利用將這些看似無關聯的數據資源轉化成具有信息成果,以實現數據的深層次價值。目前而言,簡單的對數據的查詢已經逐漸無法滿足管理者的需求,如何從大量的醫(yī)療數據中提取有助服務臨床和領導管理決策的數據顯得越來越重要,醫(yī)療數據挖掘由此應運而生。
【關鍵詞】數據挖掘中醫(yī)領域 醫(yī)療信息化
數據挖掘和數據分析根本區(qū)別在于數據挖掘在處理信息前沒有明確可能得到的目標信息。因此經過數據挖掘而獲得的信息包括信息不確定、具有深層次價值和實現度高三個特征。信息不確定指在海量數據信息中挖掘的規(guī)律具有不確定性。深層次價值主要體現在挖掘出的信息看似與數據或信息本身無關聯,但實際卻在某些方面具有相同的共性。往往經過挖掘出的數據或信息都能反應出一定的規(guī)律及關聯性,以及從深層次方面能夠提供相當程度的決策支持,因此更容易被預測或實現。
1 數據挖掘概述
數據挖掘(Data mining)又稱為知識發(fā)現(Knowledge-Discovery in Databases,簡稱:KDD),數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱藏的、未知的、潛在規(guī)律的有價值信息和知識的過程,所以數據挖掘更準確的理解應是“從數據中挖掘知識”[1]。目前進行數據挖掘研究范圍的數據多指存在數據庫系統(tǒng)中存放海量數據的數據倉庫。數據挖掘不能簡單的理解為面向特定數據庫的查詢,更不是簡單的數據檢索[2]。它從誕生開始就是面對過程的,從看似不關聯的海量數據進行系統(tǒng)的分析和推理,從深層次發(fā)現看似沒有聯系的事件過程中出現的潛在關系關聯,利用挖掘到的隱含信息指導處理實際問題,將從中發(fā)現的關聯規(guī)律對事件走向進行模擬及判斷。知識發(fā)現的過程是從這些海量數據中提取有價值的信息或規(guī)律,而在這些海量數據中不僅有直觀可以看到的符合邏輯的信息,同時數據之間由于邏輯關系的不同還存著許多未被發(fā)現的信息或規(guī)律,這些潛在的信息或規(guī)律正是我們進行數據挖掘所需要的深層次目標,尤其在中醫(yī)藥領域,發(fā)現未知的具有價值的信息對于中醫(yī)藥醫(yī)學研究的傳承和發(fā)展更具有其深遠的意義。
2 數據挖掘特點
(1)數據規(guī)模應足夠龐大,以確保反應的數據具有廣泛性。(2)用戶可以通過數據挖掘技術來發(fā)現海量數據或信息中探尋隱藏的關聯關系[3]。(3)數據挖掘對數據極為敏感,能夠對海量數據做出及時反饋,為提供決策提供必要的數據支持。(4)數據挖掘能夠發(fā)現關聯規(guī)律,同時,還要能夠及時調整規(guī)則,以便隨著探索的不斷深入具有持續(xù)性。(5)數據挖掘中關聯規(guī)律的發(fā)現源于統(tǒng)計概率,并不適用于所有的數據,關系規(guī)律達到某一閥值時,便認為有此規(guī)則[4]。
3 數據挖掘的主要功能
(1)概念描述功能。概念描述是對信息進行提煉,做出綜合描述。概念描述可實現對目標信息的總體特征的匯總,如計算出數據庫中各個數據項的總和、方差、均值等都屬于該范疇。(2)分類預測功能。分類是數據挖掘中的一個重要的體現,其目的是產生一個分類模型,利用該模型能把目標信息匯總的數據項映射到既定類別中[5]。(3)聚類分析功能。聚類是指將目標數據對象集合分組成為相對同源的或類似的簇的過程,達到不同簇之間的相似性最小、同簇數據對象的相似性最大的目標。(4)關聯分析功能。關聯分析是指發(fā)現事物之間有意義的聯系和規(guī)則。
4 數據挖掘技術在中醫(yī)行業(yè)領域中的作用
中醫(yī)藥數據挖掘是數據挖掘在眾多領域的應用之一,在中醫(yī)領域,有大量的古代中醫(yī)醫(yī)學信息和數據可以利用現代化信息技術去開發(fā)和利用,數據挖掘大有用武之地中醫(yī)藥數據分析的需求有深刻含義和深層次的哲學原理,中醫(yī)藥數據挖掘有在以下方面的具有突出貢獻:
(1)幫助中醫(yī)專家分析數據,因為從事中醫(yī)行業(yè)的醫(yī)生大多不具備專業(yè)的信息化技術水平,通過數據挖掘技術能夠將中醫(yī)理論更好的傳承下去,并且領用現代化信息技術去創(chuàng)新并完善相關的理論研究。(2)在信息化角度繼承和推進了中醫(yī)藥領域的現代化進程,在中醫(yī)藥行業(yè)領域實現創(chuàng)新。(3)利用數據挖掘技術,分析和預測中醫(yī)行業(yè)領域的相關數據,為中醫(yī)行業(yè)發(fā)展提供了強有力的數據支持。
5 結語
事實證明利用數據挖掘技術在處理不規(guī)則、繁雜的中醫(yī)行業(yè)數據時較傳統(tǒng)統(tǒng)計方式優(yōu)勢明顯。只有充分掌握中醫(yī)獨特的理論背景與實際客觀規(guī)律的情況下,充分利用現代化數據挖掘技術,才能在合理、正確的研究思路的引領下,將中醫(yī)現代化信息水平提升至一個新的高度。
參考文獻:
[1]方新麗.淺議數據挖掘技術及其應用[J].電腦知識與技術,2010(29):162-163.
[2]張新,陳宜金,趙紅蕊.面向主題的礦業(yè)信息數據倉庫建設研究[J].河北建筑科技學院學報,2000(3):56-59.
[3]韓治.數據挖掘技術及其應用研究[J].信息通信,2013(6):114-115.
[4]黃紅艷,才秀鳳,李霞.數據挖掘理論與技術研究[J].科技信息(學術版),2007(24):162-163.
[5]王瑾.“層次分析法構建挖掘模型”的基本內涵及應用效能研究[J].陜西教育(高教),2014(3):70.