劉汝元
摘 要:本文探討了在一建構(gòu)完善的數(shù)據(jù)庫中,挖掘建立利用數(shù)據(jù)挖掘的技術(shù),將其應(yīng)用在知識(shí)管理上,以有助于組織出有用的信息。期望能夠妥善地管理其知識(shí),使企業(yè)能夠更具競爭。
關(guān)鍵詞:知識(shí)管理;知識(shí)管理系統(tǒng);信息系統(tǒng);數(shù)據(jù)挖掘
一、引言
隨著時(shí)間的演進(jìn),以及生活水平的提升,造成人類經(jīng)濟(jì)活動(dòng)歷經(jīng)三個(gè)時(shí)代:農(nóng)業(yè)時(shí)代、 工業(yè)時(shí)代以及信息時(shí)代,而工作也從原先的勞力密集,漸漸轉(zhuǎn)向以腦力密集的工作為主,尤其在現(xiàn)今的信息時(shí)代里,企業(yè)強(qiáng)調(diào)的是如何運(yùn)用員工的智能與知識(shí)來創(chuàng)造新的利潤與維持競爭力。另外Peter Drucker(1993)在《后資本主義社會(huì)》中指出: 現(xiàn)今社會(huì)面臨最大的挑戰(zhàn)為“管理革命”,而這也是知識(shí)運(yùn)用的第三次變動(dòng),而前兩次的變動(dòng)分別是知識(shí)運(yùn)用在工具、制程以及產(chǎn)品上,以及知識(shí)運(yùn)用在工作上,而第三次變動(dòng)則是對知識(shí)本身作最適當(dāng)?shù)墓芾?,而在此所謂的管理就是運(yùn)用知識(shí)去找出既有知識(shí)最有效的運(yùn)用方法。換言之,即將知識(shí)應(yīng)用在有系統(tǒng)的創(chuàng)新Jeremy & Tony Hope(1997)兄弟在其所著的書中《Competing In the Third Wave》指出我們將從第二波的工業(yè)經(jīng)濟(jì)明顯地轉(zhuǎn)換到第三波以信息為基礎(chǔ)的經(jīng)濟(jì),而信息經(jīng)濟(jì)的特性是:知識(shí)將成為企業(yè)最主要的原物料,科技將是分布式作業(yè)組織生產(chǎn)的最主要工具。在此信息經(jīng)濟(jì)的環(huán)境中,智慧資本將變成衡量一家企業(yè)價(jià)值最重要的指針。
此外,在今日軟件界的巨人微軟公司的總裁比爾蓋茲于1999 年所出的著作《數(shù)字神經(jīng)系統(tǒng)—與思想等快的明日世界》中,更是明確的指出在數(shù)字神經(jīng)系統(tǒng)里,一個(gè)最重要的關(guān)鍵要素就是鏈接企業(yè)的三大系統(tǒng)功能:即知識(shí)管理、 企業(yè)經(jīng)營和電子商務(wù),以打造明日高效能的企業(yè)。而知識(shí)管理就是企業(yè)能通過所建構(gòu)的數(shù)字神經(jīng)系統(tǒng),來管理企業(yè)信息的流動(dòng),讓需要者能獲得正確的資訊,并因此能快速地采取行動(dòng),做出最好的決策。另一方面,隨著信息科技的進(jìn)步,人類對計(jì)算機(jī)的依賴程度越來越高,無論在決策的制定上,或是在數(shù)據(jù)的處理上,都必須有賴于計(jì)算機(jī)科技的協(xié)助與幫忙,甚至到現(xiàn)在,計(jì)算機(jī)已經(jīng)不再只是局限于做數(shù)據(jù)的倉儲(chǔ)或是做快速運(yùn)算的工具,而是發(fā)展出具備人工智能的功能,以協(xié)助人類作更精準(zhǔn)的判斷與決策。并且在這信息爆炸的時(shí)代里,獲得的數(shù)據(jù)數(shù)量相當(dāng)龐大,若無適當(dāng)?shù)墓芾砟J?,將?huì)造成數(shù)據(jù)泛濫,導(dǎo)致數(shù)據(jù)無法充分運(yùn)用,而形成所謂的信息垃圾, 因此要如何將過多的數(shù)據(jù)做最好的管理與運(yùn)用,便成為現(xiàn)今最熱門的研究課題,亦即要找出一種適當(dāng)?shù)臄?shù)據(jù)挖掘模式應(yīng)用在一個(gè)完善的數(shù)據(jù)庫之中。而數(shù)據(jù)挖掘的目的,乃希望能通過豐富的數(shù)據(jù)庫,來幫助人類作數(shù)據(jù)的歸類與分析動(dòng)作,進(jìn)而從中找出企業(yè)未知的現(xiàn)象及關(guān)系,讓管理者得以充分利用手邊的信息,來了解企業(yè)的問題,并提出改善及因應(yīng)之道。而數(shù)據(jù)挖掘所面臨最主要的問題為如何在大量且多樣的數(shù)據(jù)中,找出特定的模式與資訊,以有助于使用者的決策分析。
二、數(shù)據(jù)挖掘方法簡介
依不同的學(xué)習(xí)方式,學(xué)習(xí)可以劃分成兩類(Quinlan,1986)。
(1)人工神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)挖掘的相關(guān)問題也可采用人工神經(jīng)學(xué)習(xí)的方式,以幫助發(fā)掘出有用的信息。人工神經(jīng)網(wǎng)絡(luò)的基本原理主要是利用重復(fù)學(xué)習(xí)的方式,將一連串例子交予學(xué)習(xí),使其歸納出一個(gè)足以區(qū)分的模式,如此日后在后面對新的例證推導(dǎo)時(shí),進(jìn)行預(yù)測。(2)歸納學(xué)習(xí)。歸納學(xué)習(xí)的方式在數(shù)據(jù)挖掘的領(lǐng)域中受到廣泛的運(yùn)用。包含樹狀分類法、關(guān)聯(lián)數(shù)據(jù)分析法與概念數(shù)導(dǎo)向歸納學(xué)習(xí)法。樹狀分類法為利用各個(gè)屬性值, 將數(shù)據(jù)庫中的數(shù)據(jù)予以適當(dāng)?shù)姆诸悾瞥膳卸?。而在日后,也可將新增的?shù)據(jù),依據(jù)判定樹的分類方式,來將其歸至所屬的類別之中,并依據(jù)判定樹來作出最適當(dāng)?shù)姆治瞿P?。關(guān)聯(lián)數(shù)據(jù)分析法其目的在找出各種數(shù)據(jù)之間的關(guān)聯(lián)性,希望能由
數(shù)據(jù)庫中各種數(shù)據(jù)的分布情況,以了解其中彼此互動(dòng)的關(guān)系。 包含交易數(shù)據(jù)之關(guān)聯(lián)規(guī)則(Agrawal, Ghosh, Imielinski, Iyer
and Swamik,1992)、 KID3(Piatesky-Shapiro ,1991)等。
數(shù)據(jù)挖掘分析方式與統(tǒng)計(jì)分析方式最大的差異在于數(shù)據(jù)分析型態(tài):數(shù)據(jù)挖掘方法所分析的數(shù)據(jù)型態(tài)為定量數(shù)據(jù)與定性數(shù)據(jù);而至于統(tǒng)計(jì)方法所分析的數(shù)據(jù)為定量數(shù)據(jù)。所謂定量數(shù)據(jù)(Quantitative)是指:數(shù)據(jù)是由眾多數(shù)值組合而成,且針對此類數(shù)據(jù)的處理方法,可采數(shù)值分析的方法來做;而至于定性數(shù)據(jù)(Qualitative)則是指:凡是不以數(shù)值來表示,僅以類別區(qū)分的數(shù)據(jù),則稱為定性數(shù)據(jù),又稱為類別數(shù)據(jù),如性別、教育程度等
總結(jié):本研究希望通過上述的數(shù)據(jù)挖掘方法,研究知識(shí)管理系統(tǒng)的構(gòu)建,并在此系統(tǒng)中引進(jìn)數(shù)據(jù)挖掘技術(shù)。然而在此系統(tǒng)中最主要的目的在于希望能通過建構(gòu)完善的知識(shí)庫,并通過人工智能方式來提供知識(shí)工作者建議,以使得知識(shí)工作者在自我學(xué)習(xí)上有所依據(jù)與參考,并有助于知識(shí)工作者的知識(shí)提取,甚至進(jìn)一步能使組織朝向?qū)W習(xí)型組織發(fā)展,以強(qiáng)化組織的核心競爭力,使組織能夠在這變化快速的環(huán)境中立足。
參考文獻(xiàn):
[1] 王建平.數(shù)據(jù)挖掘技術(shù)的發(fā)展與研究?[期刊論文].情報(bào)雜志2007(6)
[2] 韓客松,王永成.?文本挖掘數(shù)據(jù)挖掘和知識(shí)管理[J].情報(bào)學(xué)報(bào),2001,(01):45-47.doi:10.3969/j.issn.1000-0135.2001.01.015.