/南京理工大學(xué)
隨著信息時代進(jìn)一步推進(jìn),智能時代即將來臨,知識在經(jīng)濟(jì)中的作用和地位日漸重要,已成為企業(yè)創(chuàng)新與發(fā)展的基礎(chǔ)力量,只有不斷掌握和創(chuàng)造知識的企業(yè),才能在行業(yè)的激烈競爭中不斷壯大和發(fā)展。因此,知識管理作為一種全新的管理模式能為提高企業(yè)核心競爭能力奠定基礎(chǔ)。
知識挖掘技術(shù)一直是學(xué)術(shù)界和企業(yè)界研究的熱點,知識挖掘本質(zhì)即為數(shù)據(jù)挖掘,旨在通過潛在、有價值的信息提取,提升知識的利用效率。對于內(nèi)容龐大、維度多、交叉多的知識庫而言,借助以人工智能、機(jī)器學(xué)習(xí)及語義網(wǎng)為基礎(chǔ)的數(shù)據(jù)挖掘技術(shù),將極大提升知識的使用效率。
在此,筆者通過對數(shù)據(jù)挖掘技術(shù)+知識管理的融合研究,建立通用的知識框架,實現(xiàn)知識發(fā)現(xiàn)、知識查重、知識推送、知識轉(zhuǎn)移等功能,推動知識管理在企業(yè)創(chuàng)新、技術(shù)創(chuàng)新、業(yè)務(wù)流程中發(fā)揮作用,進(jìn)而提升企業(yè)的競爭力。
知識管理系統(tǒng)已經(jīng)實現(xiàn)了顯性知識的采集、存儲、組織等全流程管理,基于知識問答、知識微博的隱性知識挖掘,以及基于本體的知識地圖的可視化展示。但隨著知識庫中的知識資源持續(xù)增加,如何實現(xiàn)知識的快速查找、知識查重、智能推送等功能,對知識管理系統(tǒng)提出了更高的要求。
一是智能技術(shù)檢索。知識管理系統(tǒng)中數(shù)據(jù)存在多樣性,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),并且數(shù)據(jù)隨著時間的推移呈指數(shù)級增長,但傳統(tǒng)檢索的覆蓋率和準(zhǔn)確度會越來越低。因此,在本體庫的基礎(chǔ)上,借助于Solr檢索引擎可實現(xiàn)基于本體的智能知識檢索,以使知識的管理水平從簡單的交互式向智能化發(fā)展。
二是基于數(shù)據(jù)挖掘的知識推送。用戶在使用知識管理系統(tǒng)的過程中,系統(tǒng)自動記錄用戶的操作行為,通過數(shù)據(jù)挖掘技術(shù)分析用戶的行為,并將相關(guān)的知識資源推送至用戶的個人中心。
三是基于崗位的知識關(guān)聯(lián)技術(shù)。在產(chǎn)品的設(shè)計過程中可以通過知識資源復(fù)用技術(shù)并借助數(shù)據(jù)挖掘技術(shù),將知識庫相關(guān)知識資源推送至設(shè)計過程相關(guān)人員的工作環(huán)境中。
四是基于業(yè)務(wù)驅(qū)動的知識推送技術(shù)。研究工作情境等知識管理理論方法,形成以業(yè)務(wù)節(jié)點為核心的知識推送技術(shù)體系,并實現(xiàn)以預(yù)研、設(shè)計、生產(chǎn)階段為核心的知識固化與推送,從而滿足多種應(yīng)用場景需求,形成知識主動找人的應(yīng)用效果。
以流程為總線,以知識管理為驅(qū)動,以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),建設(shè)現(xiàn)代化、智能化、一體化的知識管理系統(tǒng),以滿足基于大數(shù)據(jù)的知識化管理需求,提升企業(yè)的知識管理能力。
基于數(shù)據(jù)挖掘的知識管理系統(tǒng)的架構(gòu)由應(yīng)用層、支撐層和數(shù)據(jù)層組成,如圖1所示。
圖1 系統(tǒng)總體架構(gòu)
應(yīng)用層面向使用系統(tǒng)的各類用戶,通過全文檢索、知識地圖、知識社區(qū)、知識庫、專家網(wǎng)絡(luò)、系統(tǒng)推薦等模塊,為不同設(shè)計人員提供支撐。
支撐層是整個系統(tǒng)的基礎(chǔ),通過大數(shù)據(jù)處理、本體技術(shù)、數(shù)據(jù)挖掘技術(shù)、流程引擎、算法庫等功能,實現(xiàn)數(shù)據(jù)的解析與傳遞。
數(shù)據(jù)層是系統(tǒng)的資源池,為各類用戶提供協(xié)同設(shè)計過程中需要的知識、數(shù)據(jù)和文件,包括本體庫、規(guī)則庫、知識庫、專家?guī)?、算法庫及索引等?/p>
技術(shù)架構(gòu)是功能架構(gòu)的技術(shù)實現(xiàn)方式。本系統(tǒng)將基于大數(shù)據(jù)技術(shù)、知識推送、本體技術(shù)實現(xiàn)基于數(shù)據(jù)挖掘技術(shù)的知識管理系統(tǒng)。其主要通過知識采集、智能檢索、應(yīng)用等技術(shù)路線的集成,實現(xiàn)知識產(chǎn)生、識別、組織、處理、檢索、應(yīng)用的迭代過程,其系統(tǒng)技術(shù)架構(gòu)如圖2所示。
知識采集。在任務(wù)管理、知識上傳及流程管理過程中,通過開展項目需求分析、設(shè)計、總結(jié)、流程分析等過程,將整個過程使用支撐資源、約束資源進(jìn)行存儲。最后,通過知識萃取技術(shù)將知識資源進(jìn)行梳理,再存入知識庫。
智能檢索。為了實現(xiàn)多源知識庫快速檢索,以知識屬性的關(guān)鍵詞搜索為基礎(chǔ),基于Solr引擎和本體技術(shù)實現(xiàn)知識庫、社區(qū)庫、流程庫、崗位知識庫等數(shù)據(jù)信息的全文快速檢索及分類展示等功能。
知識應(yīng)用。在項目管理、崗位流程中,根據(jù)人員的專業(yè)背景、項目背景、流程節(jié)點等因素,通過知識挖掘與推送技術(shù)將相關(guān)知識資源推送給用戶,進(jìn)而幫助用戶完成知識復(fù)用、任務(wù)分解、流程驅(qū)動等功能。
智能搜索就是結(jié)合人工智能技術(shù)提高知識全文檢索的準(zhǔn)確性、全面性,還能提供用戶興趣自動識別、內(nèi)容的語義理解、智能化過濾和推送功能。本體提出了基于Solr和本體技術(shù)進(jìn)行關(guān)聯(lián)搜索,通過本體解析技術(shù)識別本體庫中的同義詞、近義詞,再通過Solr解析引擎實現(xiàn)全文檢索,其整體流程如圖3所示。
圖2 系統(tǒng)技術(shù)架構(gòu)
圖3 智能檢索技術(shù)
知識智能梳理是根據(jù)用戶構(gòu)建的行業(yè)知識樹,應(yīng)用數(shù)據(jù)挖掘技術(shù)對知識樣本進(jìn)行特征提取,根據(jù)提取的內(nèi)容自動歸類知識樣本。知識智能梳理是基于行業(yè)知識的文本自動分類方法,首先根據(jù)行業(yè)知識特點建立行業(yè)知識樹,然后對行業(yè)知識樹進(jìn)行語義分析,從而得出行業(yè)知識的分類方式。 知識智能梳理流程包括行業(yè)知識樹的構(gòu)建和對樣本知識的分類算法的實現(xiàn),其整體流程如圖4所示。
行業(yè)知識樹。不同行業(yè)和應(yīng)用對象的知識組織具有不同的特征,行業(yè)知識樹根據(jù)行業(yè)特征定義知識的層次結(jié)構(gòu)及語義關(guān)系,從而描繪整個行業(yè)知識,包括知識分類的屬性信息。
知識分類算法。根據(jù)行業(yè)知識樹對樣本知識進(jìn)行特征提取,根據(jù)特征信息對樣本知識進(jìn)行分類,并存入知識庫。
基于機(jī)器學(xué)習(xí)的知識查重涉及知識文本分詞、文本分類、機(jī)器學(xué)習(xí)訓(xùn)練以及查重邏輯和評估等主要關(guān)鍵技術(shù)。在知識分類過程中,針對未標(biāo)注文本需用機(jī)器學(xué)習(xí)訓(xùn)練階段獲得的分類方法進(jìn)行分類判斷。在分類判斷基礎(chǔ)上,針對新樣本文本進(jìn)行完全字符匹配,以段落及連續(xù)n個字符為單位(n可配置)進(jìn)行逐篇遍歷查詢,累計獲取知識全文的重復(fù)率,再結(jié)合知識歸類相似度進(jìn)行權(quán)重加權(quán),以獲取總相似率,具體過程如圖5所示。
圖4 基于數(shù)據(jù)挖掘的知識自動分類
圖5 文本分類及查重的主要流程
圖6 基于情境感知的知識推送流程
在訓(xùn)練過程,首先從上傳知識中獲取全文文本,分詞并去除停用詞;然后按照一定的算法從標(biāo)注好類別的訓(xùn)練樣本中獲取預(yù)期的分類器,可以采用多種算法進(jìn)行分類,也可以在數(shù)據(jù)離散化后使用簡單向量距離分類法方法得出—個決策樹,作為預(yù)期的分類器。
知識推送屬于知識管理中一種新的獲取策略,通過改變傳統(tǒng)的知識獲取方式,系統(tǒng)自動將相關(guān)知識資源推送給用戶,實現(xiàn)以人為中心的知識組織,同時根據(jù)員工不同的知識水平推送相應(yīng)的領(lǐng)域知識,或根據(jù)用戶行為模型有針對性地為用戶推送相關(guān)知識。
基于用戶行為的知識推送。根據(jù)用戶的專業(yè)背景、瀏覽記錄和業(yè)務(wù)場景挖掘關(guān)聯(lián)知識并進(jìn)行主動推送,主要包括用戶行為特征獲取功能、用戶興趣模型構(gòu)建功能、用戶知識推薦功能等。
基于情境感知的知識推送。根據(jù)情境實時動態(tài)的變化情況,動態(tài)評估應(yīng)急情境的相似度,進(jìn)而生成知識需求,依據(jù)知識的需求和推送規(guī)則將所需知識實時推送給相應(yīng)的應(yīng)用系統(tǒng)或領(lǐng)域?qū)<遥淞鞒倘鐖D6所示。
筆者通過分析數(shù)據(jù)挖掘在提高知識管理系統(tǒng)智能化方面的支持和應(yīng)用,分析系統(tǒng)需求,提出了基于數(shù)據(jù)挖掘的知識管理系統(tǒng)總體架構(gòu)及其關(guān)鍵技術(shù)。后續(xù),根據(jù)業(yè)務(wù)發(fā)展需求還將進(jìn)一步完善系統(tǒng)的相關(guān)功能,以期為新一代知識管理系統(tǒng)建設(shè)奠定基礎(chǔ)。