亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)驅(qū)動的專家知識資源建模方法與原型系統(tǒng)開發(fā)研究

        2019-04-01 12:43:50戰(zhàn)洪飛余軍合魏保偉
        計算機應(yīng)用與軟件 2019年2期
        關(guān)鍵詞:規(guī)則資源信息

        張 琪 戰(zhàn)洪飛 余軍合 魏保偉

        (寧波大學(xué)機械工程與力學(xué)學(xué)院 浙江 寧波 315211)

        0 引 言

        知識資源是決定企業(yè)競爭優(yōu)勢的重要資源,但由于企業(yè)知識管理實踐的缺乏及知識管理應(yīng)用理論的不足,使企業(yè)在業(yè)務(wù)執(zhí)行中的知識資源配置能力較差,不能夠很好地將正確的資源用在正確的業(yè)務(wù)上。同時,知識資源配置上的不足也造成企業(yè)業(yè)務(wù)執(zhí)行績效低下,阻礙企業(yè)創(chuàng)新能力的提升。因而,如何有效經(jīng)營企業(yè)的知識資源,在盤活企業(yè)內(nèi)部知識資源的基礎(chǔ)上如何高效利用企業(yè)外部的專家資源,這都是對企業(yè)競爭力有重大影響的核心問題。然而,目前專家知識資源信息建模技術(shù)與方法上的研究成果不能滿足企業(yè)的需求,企業(yè)難以獲取這些專家資源信息,優(yōu)化知識配置更無從談起。針對這一問題,本文提出基于大數(shù)據(jù)技術(shù)及廣域的開源數(shù)據(jù),構(gòu)建比較合理的專家資源模型,為企業(yè)開展面向業(yè)務(wù)執(zhí)行的知識資源配置提供基礎(chǔ)理論參考。為了提高知識資源的求解效率,并及時提供需求的知識資源,國內(nèi)外學(xué)者已開展了較豐富的研究。

        文獻[1]認(rèn)為知識資源的獲取在專家知識系統(tǒng)的構(gòu)建是需要通過解決的實際問題,并基于“洞察力”的假設(shè)理念為知識獲取和表示工具提供適合的哲學(xué)環(huán)境。文獻[2]認(rèn)為知識獲取在未來應(yīng)該從狹隘的技術(shù)、結(jié)構(gòu)和模型概念轉(zhuǎn)移到對業(yè)務(wù)問題求解的專家系統(tǒng)的需求上。文獻[3]引入知識獲取技術(shù)提高組織知識的位置、所有權(quán)及影響的理解,而不是機構(gòu)執(zhí)行的數(shù)據(jù)流和任務(wù),并為組織問題解決知識獲取提供了指導(dǎo)原則。文獻[4]基于問題領(lǐng)域特征來規(guī)定某些知識獲取技術(shù),以生產(chǎn)和運營管理(P/OM)領(lǐng)域作為研究的試點領(lǐng)域,將P/OM任務(wù)映射到問題域的一般分類方式。根據(jù)分類的結(jié)果構(gòu)建描述具有顯著知識的獲取技術(shù)。文獻[5]在訪談的層面上,結(jié)合工業(yè)界的高級管理人員擔(dān)任實驗課題,比較非結(jié)構(gòu)化知識和結(jié)構(gòu)化知識獲取的方法,發(fā)現(xiàn)采用結(jié)構(gòu)化訪談方法獲取知識可以提高績效。文獻[6]認(rèn)為在業(yè)務(wù)領(lǐng)域中問題以及求解的策略在選擇方面存在很大的差異,采用問題分解和簡化技術(shù)以便為管理決策提供適當(dāng)?shù)男畔?。郭健美等[7]在基于業(yè)務(wù)問題求解的實際需求方面,提出了一種對于知識供應(yīng)過程的業(yè)務(wù)問題求解模型。王德川等[8]針對企業(yè)業(yè)務(wù)問題求解時方案制定不合理的現(xiàn)象,將企業(yè)中的知識庫用領(lǐng)域建模的方式進行重新整理建模 ,設(shè)計了一種面向特定領(lǐng)域建模方法。姚平等[9]為了提取決策知識,采用將模糊集和粗糙集理論相結(jié)合的方法獲取知識資源。羅琳等[10]從數(shù)據(jù)的內(nèi)涵出發(fā),提出了知識流動的特點,采用“數(shù)據(jù)-人-知識”模型,構(gòu)建了其理論框架,應(yīng)用在產(chǎn)學(xué)研協(xié)同創(chuàng)新知管網(wǎng)研究。劉驪等[11]以服裝數(shù)據(jù)作為驅(qū)動力,構(gòu)建三維服裝模型,提高服裝建模的效率。徐建國等[12]采用數(shù)據(jù)驅(qū)動的方式,采用技術(shù)評論數(shù)據(jù),應(yīng)用在技術(shù)網(wǎng)絡(luò)模型構(gòu)建。楊青等[13]以工程管理的角度,采用數(shù)據(jù)驅(qū)動的方式,將工程管理按照時間維度、領(lǐng)域維度和方法維度三個維度,挖掘數(shù)據(jù)信息,及各個生命階段的數(shù)據(jù)類型。程進等[14]以個性化制造企業(yè)流程工藝參數(shù)據(jù)作為驅(qū)動力,研究其參數(shù)匹配方法, 有效地為制造工藝知識提供服務(wù)。

        綜合國內(nèi)外的相關(guān)研究可以看出,以數(shù)據(jù)作為驅(qū)動,結(jié)合映射規(guī)則獲得更加全面的知識資源應(yīng)用在業(yè)務(wù)問題的求解方面的研究和應(yīng)用較少,尤其是在知識資源獲取方法方面仍需要進一步研究[15-21]。

        以開放數(shù)據(jù)資源進行知識模型構(gòu)建仍舊存在較多的有價值性的工作。本文從企業(yè)業(yè)務(wù)問題求解進行分析,以數(shù)據(jù)作為驅(qū)動力,利用已有的網(wǎng)絡(luò)數(shù)據(jù)資源,基于映射規(guī)則的方法進行推理,填充企業(yè)業(yè)務(wù)問題求解的專家知識資源模型,令專家知識資源模型更加全面細致,并研究數(shù)據(jù)驅(qū)動的專家知識資源模型方法,進行專家知識資源原型系統(tǒng)開發(fā)。

        1 模型構(gòu)建

        1.1 模型維度的確定

        面向業(yè)務(wù)問題求解的專家知識資源建模是從業(yè)務(wù)問題求解需求的角度出發(fā)構(gòu)建的,在業(yè)務(wù)的執(zhí)行過程中,會遇到比較復(fù)雜的業(yè)務(wù)難題或困難,本文將這類困難與難題的解決稱為業(yè)務(wù)問題求解。而對于業(yè)務(wù)問題求解的發(fā)生源于業(yè)務(wù)問題的出現(xiàn),業(yè)務(wù)問題的出現(xiàn)是企業(yè)業(yè)務(wù)人員在執(zhí)行不同業(yè)務(wù)活動發(fā)生,因此,根據(jù)找到業(yè)務(wù)問題求解的源頭,對其進行解析,使出現(xiàn)業(yè)務(wù)問題時能夠及時得到求解的方案,從而繼續(xù)推進整個業(yè)務(wù)活動。從中可以發(fā)現(xiàn),業(yè)務(wù)問題求解的需求知識與專家知識資源的構(gòu)建之間有密不可分的關(guān)系,如圖1所示。

        圖1 業(yè)務(wù)需求與專家知識資源的關(guān)系模型圖

        在實際求解業(yè)務(wù)問題中的過程中,業(yè)務(wù)問題是具有多層次的結(jié)構(gòu),所以,業(yè)務(wù)求解需求就是按照層次粒度集成的集合體。根據(jù)此特性,業(yè)務(wù)求解需求是為業(yè)務(wù)問題提供服務(wù),所以,業(yè)務(wù)需求也具有多層次的結(jié)構(gòu)。圍繞業(yè)務(wù)需求的涉及的知識資源角度,結(jié)合其多層次結(jié)構(gòu)的特點,以企業(yè)中一系列的業(yè)務(wù)案例為例,分別從企業(yè)業(yè)務(wù)項目層次需求維度、知識領(lǐng)域需求維度、產(chǎn)品生命周期需求維度將企業(yè)業(yè)務(wù)需求的知識資源進行分類,為專家知識資源建模做準(zhǔn)備。

        結(jié)合劉則晴等[22]構(gòu)建的業(yè)務(wù)問題模型,在此基礎(chǔ)上,構(gòu)建了業(yè)務(wù)需求的模型:

        PK={Xk,Yk,Zk}k=1,2,…,n

        式中:k為企業(yè)業(yè)務(wù)求解需求編號,n為當(dāng)前企業(yè)內(nèi)的業(yè)務(wù)求解需求總數(shù)。

        Xk={xki,i=1,2,3},xki表示第k個業(yè)務(wù)求解需求處于i層次的需求層次維度。

        Yk={ykj,j=1,2,…,m},ykj表示第k個業(yè)務(wù)求解需求的知識領(lǐng)域維度總數(shù)。

        Zk={zkt,t=1,2,…,n},zkt表示第k個業(yè)務(wù)求解需求的產(chǎn)品生命周期維度個數(shù)。

        由于業(yè)務(wù)需求所處的項目層次維度不同,其求解的過程中所需要的知識資源也是存在差異性的,因而需求的專家知識資源也存在很大的差異性。

        盡管項目層次不同,但專家知識資源每個維度的知識領(lǐng)域卻存在著相似性。因此,該專家雖然處于不同項目、任務(wù)、活動層面中,但是都需要找到能夠與專家知識資源屬性一致的知識結(jié)構(gòu),而該結(jié)構(gòu)的構(gòu)成則可以定義為專家的知識單元維度。

        在項目層次維度所處的任務(wù)層次,以及解決何種業(yè)務(wù)問題是根據(jù)專家的業(yè)務(wù)經(jīng)驗及經(jīng)歷。因而,確立了該專家的業(yè)務(wù)經(jīng)驗及經(jīng)歷維度和教育經(jīng)歷維度。

        在業(yè)務(wù)問題求解的配置過程中,會出現(xiàn)專家之間的相互配合情況,若要業(yè)務(wù)問題能夠順利得到解決,就需要對專家的脾氣秉性特征,及愛好等有所了解,因此,我們建立了專家知識資源模型中的又一個維度即愛好及特征,旨在業(yè)務(wù)問題求解的知識應(yīng)用情景中為業(yè)務(wù)配置能夠順利進展推進,并為專家在解決問題時創(chuàng)造舒適環(huán)境,從而使業(yè)務(wù)問題能夠高效合理地解決。

        根據(jù)產(chǎn)品生命周期需求維度分析,主要是考慮該產(chǎn)品需求分析、設(shè)計、生產(chǎn)、銷售、售后、到回收階段,需要專家面對該流程中業(yè)務(wù)運營產(chǎn)生的問題,求解業(yè)務(wù)問題的能力,從中可以得到該專家知識資源模型中的業(yè)務(wù)能力維度。

        通過對業(yè)務(wù)需求進行解析,本文確立了專家知識資源的六個維度信息,分別為專家的基本屬性、業(yè)務(wù)經(jīng)驗及經(jīng)歷、業(yè)務(wù)能力、教育經(jīng)歷、知識單元、愛好及特征。對每個維度又可以進一步細分,以此作為專家知識資源與求解業(yè)務(wù)問題需求契合度的依據(jù),并為專家知識資源模型提供基礎(chǔ)。

        數(shù)據(jù)驅(qū)動中數(shù)據(jù)即為專家知識資源模型的維度信息,驅(qū)動專家知識模型的構(gòu)建。

        1.2 模型構(gòu)建

        結(jié)合上述的專家知識資源維度的分析,本文提出依托網(wǎng)絡(luò)數(shù)據(jù)資源,基于規(guī)則抽取、數(shù)據(jù)檢索及數(shù)據(jù)挖掘技術(shù)的專家知識資源模型,如圖2所示。首先專家模型的建立需要滿足業(yè)務(wù)問題求解時對專家需求,利于實現(xiàn)專家知識資源的配置;另外如何獲取專家資源信息及建立專家資源信息庫,這也是業(yè)務(wù)求解過程中的關(guān)鍵。

        圖2 數(shù)據(jù)驅(qū)動的專家知識資源模型框架

        圖2中對專家知識資源模型中的6個維度及其維度進行細分,并表示了每個維度信息之間的相互關(guān)系,及如何獲取專家知識模型資源中相對應(yīng)的數(shù)據(jù)獲取方式。以教育經(jīng)歷為例,其細分的維度為該專家的受教育時間(when)、受教育的學(xué)校即地點(where)、受教育的學(xué)習(xí)的專業(yè)信息(major),即為“2W1M”。該維度信息的獲得可以采用搜索方式,但有時該專家的某些信息又不能直接通過網(wǎng)絡(luò)搜索獲得,例如張三的畢業(yè)學(xué)校無法獲取,但從網(wǎng)絡(luò)數(shù)據(jù)中發(fā)現(xiàn)張三與李四是大學(xué)同學(xué),而李四的畢業(yè)學(xué)??色@取。因而,就可以推斷出張三的畢業(yè)學(xué)校?;谶@樣的構(gòu)思,本文提出基于數(shù)據(jù)挖掘或基于規(guī)則推理得方式從網(wǎng)絡(luò)數(shù)據(jù)中抽出不能直接獲取的相關(guān)信息。

        (1) 專家的基本屬性 基本屬性是作為業(yè)務(wù)求解過程中便于業(yè)務(wù)人員聯(lián)系專家,了解專家的基本狀況之用。該維度信息知識特征具有平行結(jié)構(gòu),無先后的順序,采用表格的形式記錄該基本屬性的細分維度。該數(shù)據(jù)是由搜索方式得到的數(shù)據(jù),若不能直接獲得數(shù)據(jù)則由推理規(guī)則獲取,如表1所示。

        表1 專家的基本屬性

        (2) 專家的教育經(jīng)歷 專家所掌握的基本知識與能力信息,是關(guān)于個體比較全局的知識與能力描述。該知識結(jié)構(gòu)為“2W1M”,相互之間是關(guān)聯(lián)關(guān)系。具體包括專家學(xué)習(xí)旅程中不同階段,分別為大學(xué)、研究生、博士生等,以及在什么時間進入什么樣的院校學(xué)習(xí)什么專業(yè)。如表2所示。

        表2 專家的教育經(jīng)歷

        (3) 專家的業(yè)務(wù)能力 與業(yè)務(wù)求解密切相關(guān)的信息需求,了解專家能力特點是否可以為業(yè)務(wù)崗位需求相匹配。其知識結(jié)構(gòu)是按其掌握的熟練程度等級劃分,所以以金字塔的方式描述。該維度是由業(yè)務(wù)領(lǐng)域水平、語言溝通能力、組織協(xié)調(diào)能力、團隊協(xié)作能力、全局意思能力組成。同時,根據(jù)基于規(guī)則的推理進行該維度的等級分類。

        該維度主要是以研究領(lǐng)域作為研究專家業(yè)務(wù)能力的關(guān)鍵信息。如圖3所示,把研究領(lǐng)域細化到10個相應(yīng)的維度,分別是主要研究方向、學(xué)術(shù)論文影響因素、論文被引次數(shù)、榮譽和獎勵、科研榮譽稱號、應(yīng)用案例、專利項目、科研項目、社會及學(xué)術(shù)兼職、主要著作和論文。根據(jù)上述10個細分維度,將專家業(yè)務(wù)能力更加具體展示給企業(yè)業(yè)務(wù)需求人員,作為企業(yè)業(yè)務(wù)應(yīng)用專家知識資源提供參考。

        圖3 專家的業(yè)務(wù)能力圖

        (4) 專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗 專家的業(yè)務(wù)經(jīng)歷和經(jīng)驗的描述,進一步展示專家能力范圍,而且此維度也最能反映專家過往與當(dāng)前的能力特長,是進行專家資源配置的重要理論依據(jù)。圖4為該專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗知識模型圖。

        圖4 專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗?zāi)P蛨D

        每個專家在人生的不同階段都會遇到不同的專家,專家們相互交流,共同工作,知識會相互組合,并且創(chuàng)造形成新的知識。從專家自身的閱歷和經(jīng)驗,形成知識體系,專家知識是具有包含的關(guān)系等,從知識的寬度領(lǐng)域逐漸向深度邁進,形成專家自身的知識體系結(jié)構(gòu),為業(yè)務(wù)問題求解效率帶來提升和改進。

        (5) 專家的知識單元 知識單元是對專家所在知識領(lǐng)域中具體的知識結(jié)構(gòu)的最直接闡述。結(jié)合面向業(yè)務(wù)求解的知識資源配置的需要,對其知識結(jié)構(gòu)進行細致的分類。如圖5所示,其相互之間的關(guān)系是包含的關(guān)系,對于知識體系進行逐級分層,從而在業(yè)務(wù)問題求解時能夠及時找到需要的專家,并將專家的知識單元按照對知識掌握的熟練程度進行劃分。

        圖5 專家的知識單元

        知識單元主要是按照對于知識的掌握的熟悉度,從一般到熟練,挖掘到專家構(gòu)建和掌握其知識體系的方式是源自于其教育生涯中科目信息,每個專家在知識獲取上都是以科目信息的傳授和深入挖掘,來構(gòu)建其完整的知識體系。因此,以科目信息建立規(guī)則,尋找相似知識單元結(jié)構(gòu)的專家,構(gòu)建專家知識資源模型。

        (6) 專家的愛好及特征 該維度的模型信息是為業(yè)務(wù)求解中團隊成員間可能的默契和配合程度而考慮的,在知識資源配置的協(xié)調(diào)決策中發(fā)揮輔助作用。如圖6所示,該維度信息主要是按照樹狀結(jié)構(gòu)進行分類,找到專家的興趣點。其中主要包括專家喜好是運動類、文藝類,及專家的特征是有無宗教信仰、有無潔癖等特殊習(xí)慣。

        圖6 專家的愛好及特征圖

        2 建模方法研究

        如圖2所示,數(shù)據(jù)獲取的方式有一種或者兩種方式結(jié)合甚至更多,本文結(jié)合專家知識資源模型構(gòu)建的數(shù)據(jù)需要,總結(jié)出3種數(shù)據(jù)獲取的方式,分別為基于規(guī)則的推理、基于數(shù)據(jù)檢索、基于數(shù)據(jù)挖掘的獲取方式。

        2.1 基于規(guī)則的推理獲取方法

        由于數(shù)據(jù)的廣泛性,圖2中各維度模型中的信息很難從數(shù)據(jù)源中直接獲取,因而本文定義數(shù)據(jù)分析挖掘的映射規(guī)則,建立模型映射的規(guī)則庫。所謂的規(guī)則就是從數(shù)據(jù)源信息推導(dǎo)出模型信息的推理原則,如圖7所示。

        圖7 基于規(guī)則的獲取流程圖

        廣義多源數(shù)據(jù)是指互聯(lián)網(wǎng)中開放的數(shù)據(jù)源;獲取規(guī)則,主要是基于推理規(guī)則的方式獲取專家模型,根據(jù)業(yè)務(wù)需求的知識資源,利用推理規(guī)則填充專家知識模型某些維度信息的數(shù)據(jù)。例如:A專家1994年本科畢業(yè)清華大學(xué)的機械制造及其自動化專業(yè),那么從這條專家的個人信息中,可以定義規(guī)則“該專家應(yīng)該基本具有機械制造及自動化領(lǐng)域的基本專家知識與技能,并基本具有1994年清華大學(xué)所開設(shè)專業(yè)知識中的知識單元結(jié)構(gòu)”?;谶@條規(guī)則,所需獲取的進一步信息就是獲取1994年清華大學(xué)機械制造及其自動化專業(yè)的本科課程體系,或獲取與A專家相近就學(xué)情形的其他專家的個人信息,以此推導(dǎo)出A專家可能的知識單元維度信息構(gòu)成及教育經(jīng)驗維度的求學(xué)信息。

        通過不斷積累的大量規(guī)則的建立,利用軟件技術(shù)即可實現(xiàn)專家資源模型信息的自動獲取。使專家模型的數(shù)據(jù)信息更加完整。

        專家知識的推理規(guī)則可表示為:

        規(guī)則1:If “時間=×××”and“地點=某高校名稱”and“專業(yè)=教育部開設(shè)某專業(yè)名稱”,then“該專家的科目信息=具體根據(jù)教育部制定與修訂《普通高等教育學(xué)校本科專業(yè)目錄》中的信息確定該專家科目信息的知識結(jié)構(gòu)”。

        規(guī)則2:If “A專家與B為同時同學(xué)校同專業(yè)”,then“該專家A與專家B具有相同的科目信息和知識結(jié)構(gòu)”。

        規(guī)則3:If “申請項目團隊人數(shù)>5”and“撰寫論文的團隊人數(shù)>5”and“專家參與的科研活動”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力較強”。

        If “申請項目團隊人數(shù)>5”and“撰寫論文的團隊人數(shù)>5”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力較強”。

        If “申請項目團隊人數(shù)>5”and“撰寫論文的團隊人數(shù)>5”and“專家參與的科研活動”,then“團隊能力較強”。

        If “申請項目團隊人數(shù)>5”and“專家參與的科研活動”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力較強”。

        If “撰寫論文的團隊人數(shù)>5”and“專家參與的科研活動”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力較強”。

        If “申請項目團隊人數(shù)>5”and“撰寫論文的團隊人數(shù)>5”,then“團隊能力一般”。

        If “申請項目團隊人數(shù)>5”and“專家參與的科研活動”,then“團隊能力一般”。

        If “申請項目團隊人數(shù)>5”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力一般”。

        If “撰寫論文的團隊人數(shù)>5”and“專家參與的科研活動”,then“團隊能力一般”。

        If “撰寫論文的團隊人數(shù)>5”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力一般”。

        If “專家參與的科研活動”and“該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力一般”。

        If “申請項目團隊人數(shù)>5”,then“團隊能力較弱”。

        If “撰寫論文的團隊人數(shù)>5”,then“團隊能力較弱”。

        If “專家參與的科研活動”,then“團隊能力較弱”。

        If “該專家的存在社會及學(xué)術(shù)兼職”,then“團隊能力較弱”。

        滿足以上三條及其以上的內(nèi)容,該專家的業(yè)務(wù)能力較強。滿足兩條,該專家的團隊能力一般。滿足上面一條內(nèi)容則該專家的團隊能力較弱。

        專家業(yè)務(wù)能力維度的描述,以該專家的團隊能力維度進行其推理規(guī)則的詳細闡述,其他細分維度信息獲取規(guī)則方式與此相同,由于篇幅問題,暫不贅述。

        規(guī)則4:If “描述該專家的信息出現(xiàn)干凈,整潔”,and“出現(xiàn)程度副詞,較,極其”,then“該專家有潔癖習(xí)慣”。

        If “該專家信仰某種宗教”or“該專家信仰佛教”,then“該專家有宗教信仰”。

        If “描述該專家做事嚴(yán)謹(jǐn)”and“被評為某種具有嚴(yán)謹(jǐn)工作性質(zhì)的獎項,帶有程度副詞”or“該專家被評為某種帶有感情色彩,我最喜愛,我最敬佩”,then“該專家做事嚴(yán)謹(jǐn),平易近人”。

        專家愛好及特征維度信息的描述,主要是根據(jù)描述信息出現(xiàn)的關(guān)鍵詞及修飾該關(guān)鍵詞的程度副詞進行數(shù)據(jù)推理和填充。

        2.2 基于數(shù)據(jù)檢索的獲取技術(shù)

        根據(jù)網(wǎng)上已存在的數(shù)據(jù),通過對其數(shù)據(jù)進行關(guān)鍵詞檢索得到的數(shù)據(jù)信息可直接填充進專家知識模型細分的維度信息內(nèi)容,如圖2所示。以專家知識資源中的教育經(jīng)歷為例,進行維度信息的獲取。提出基于數(shù)據(jù)挖掘中廣泛使用的網(wǎng)絡(luò)爬蟲技術(shù),從互聯(lián)網(wǎng)環(huán)境中廣泛獲取與專家相關(guān)的各類信息,作為數(shù)據(jù)挖掘的數(shù)據(jù)源。

        某些數(shù)據(jù)經(jīng)過檢索得到,但是,并不能直接填充到專家知識模型中相對應(yīng)的字段維度信息,需要對檢索到的數(shù)據(jù)進行相關(guān)的處理,本文采用數(shù)據(jù)統(tǒng)計的方式,具體應(yīng)用于專家的文獻被引次數(shù)及專家成果影響因素和專家論文被引次數(shù)。

        2.2.1 論文被引總次數(shù)及成果影響因素

        論文被引總次數(shù)的確定,方便對專家進行配置時提供相應(yīng)的理論參考。該方法的計算方式,主要是按照參考文獻中作者的排序作為其貢獻影響的依據(jù)。若為第一作者,則其貢獻量最大,則按引用次數(shù)與因子1相乘,若作者是第二位及其之后出現(xiàn),將引用次數(shù)按照總?cè)藬?shù)平分,具體計算如下所示:

        (1)

        式中:a1,a2,…,an指專家為第一位作者的引用次數(shù);b1,b2,…,bn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是2個人;c1,c2,…,cn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是3個人;d1,d2,…,dn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是4個人;e1,e2,…,en指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是5個人,由于一般學(xué)術(shù)論文規(guī)定的最多人數(shù)為5個人,所以,本文將專家論文被引用次數(shù)按最多人數(shù)為5個人進行其引用次數(shù)總和計算。

        2.2.2 成果影響因素計算

        成果影響因素,文中的成果影響因子主要是根據(jù)文章被引次數(shù),完成其影響成果的確定,之所以要計算成果因素,是為專家在配置知識資源時提供相應(yīng)的數(shù)據(jù)參考,決定哪位專家在同一領(lǐng)域中更適合勝任該工作。本文采用文獻[23]介紹的I3(Integrated Impact Indicator)[24],I3使用的是無參統(tǒng)計的方式評價偏態(tài)分布的期刊被引頻次,并且利用標(biāo)準(zhǔn)差來檢驗評價結(jié)果,對于期刊評價法和科研人員評價比期刊因子更加合理。本文采用科研指標(biāo)I3,計算公式如下:

        Ia=∑ixi·f(xi)

        (2)

        式中:xi表示第i等級的權(quán)值,f(xi)表示該權(quán)值為xi的論文出現(xiàn)的數(shù)量?;谥锌圃簩τ谄诳膭澐諿23]并結(jié)合PR6[24],對該權(quán)值與等級的劃分范圍進行調(diào)整,并根據(jù)專家學(xué)術(shù)論文的等級進行了重新界定。

        2.3 基于數(shù)據(jù)挖掘的獲取技術(shù)

        如圖1所示,專家知識資源模型框架充分考慮了企業(yè)業(yè)務(wù)問題求解時的知識需求,而對于模型各維度實例信息的獲取,本文采用互聯(lián)網(wǎng)中的開源數(shù)據(jù)挖掘技術(shù)來實現(xiàn)?;玖鞒倘鐖D8所示。

        圖8 基于數(shù)據(jù)挖掘的流程圖

        該流程主要以對專家摘要、論文摘要、專家數(shù)據(jù)進行清洗、提取專家專利數(shù)據(jù)、論文摘要數(shù)據(jù)中的描述專家研究領(lǐng)域及方向的術(shù)語、利用互信息的分詞方式提取關(guān)鍵詞。

        對專家摘要、論文摘要、專家數(shù)據(jù)進行數(shù)據(jù)清洗,利用了數(shù)據(jù)清洗的理念,去除數(shù)據(jù)的雜質(zhì)。

        提取專家專利數(shù)據(jù)、論文摘要數(shù)據(jù)中的描述專家研究領(lǐng)域及方向的術(shù)語,采用對數(shù)據(jù)進行分詞處理。

        利用互信息的分詞方式提取關(guān)鍵詞:本文采用一種無監(jiān)督學(xué)習(xí)的專業(yè)領(lǐng)域分詞歧義方法[25],采用互信息的方式,因為其分詞效果較好,且具有穩(wěn)定性。該方法采用定量估計兩個漢字間的結(jié)合力方式,從而確定兩個字之間的聯(lián)系強度,以此作為依據(jù)判斷兩個字是否需要進行分詞。但由于某些領(lǐng)域的專家的研究方向并不僅限于兩個漢字之間,例如某專家擅長“知識管理”,如果只是兩個詞之間的緊密度的話,分詞就為“知識/管理”與研究領(lǐng)域的專家知識描述相違背。因而,本文采用是多字詞的互信息。即一個詞由多個字組成時,先計算專業(yè)研究領(lǐng)域的兩兩臨近字的互信息,再取平均值。算法如下:

        (3)

        mi(xi,xi+1)指兩兩相近字的互信息,其計算方式如下:

        (4)

        式中:xi、xi+1指兩個相近字。用mi表示兩個詞的相近度,以此作為研究分詞的理論依據(jù),確立得到的分詞信息能夠描述專家的研究領(lǐng)域的知識資源信息,更好地解釋專家的研究領(lǐng)域內(nèi)容。同時進行關(guān)鍵詞提取及詞頻統(tǒng)計,為基于推理規(guī)則的方式獲取模型數(shù)據(jù)做準(zhǔn)備。

        通過編寫網(wǎng)絡(luò)爬蟲程序爬取專家知識資源信息,構(gòu)建專家知識模型。根據(jù)上述三種方式,節(jié)省數(shù)據(jù)清洗和數(shù)據(jù)處理步驟,利用爬蟲直接獲取該專家模型需求的信息源。

        3 原型系統(tǒng)開發(fā)

        為了能夠方便開發(fā)者進行開發(fā),本節(jié)設(shè)計并開發(fā)該數(shù)據(jù)驅(qū)動的基于規(guī)則映射形成的專家知識資源原型系統(tǒng),為專家知識資源配置服務(wù)做準(zhǔn)備。采用PHP+MySQL的模式進行Web開發(fā),基于B/S框架。數(shù)據(jù)庫采用標(biāo)準(zhǔn)的SQL語言,由于MySQL是具有開放源代碼的特點,因此,可以根據(jù)用戶個人需要需求的要求進行修改。PHP是一種嵌入到HTML中的腳本語言,絕大多部分源于C語言,也有少數(shù)承自Java和Perl,并由服務(wù)器進行解釋的腳本語言。本系統(tǒng)使用的軟件開發(fā)環(huán)境為:Windows10,MySQL Sever11.0.10.(數(shù)據(jù)庫),PHPSTUDY20180211(調(diào)試環(huán)境),PhpStorm(編程軟件)。圖9為該系統(tǒng)的框架圖。

        圖9 系統(tǒng)架構(gòu)圖設(shè)計

        根據(jù)圖2和圖9的理論框架設(shè)計構(gòu)圖的模型,構(gòu)建專家知識模型系統(tǒng)如圖10所示。

        圖10 數(shù)據(jù)驅(qū)動的專家知識資源模型系統(tǒng)

        4 應(yīng)用實例

        本模型以實驗室為研究對象,進行了該系統(tǒng)的測試和試驗,驗證了該方案的可行性。具體操作是通過輸入某位專家的名字得到其相應(yīng)的數(shù)據(jù)信息,顯示了專家信息中部分維度中的數(shù)據(jù)信息,分別是業(yè)務(wù)經(jīng)驗及經(jīng)歷維度,進行實例展示。同時,在科目信息旁邊有一個紅色驚嘆號的標(biāo)志,可以看到該數(shù)據(jù)的獲取方法,如圖11所示。

        圖11 數(shù)據(jù)驅(qū)動的專家知識資源部分模型系統(tǒng)

        5 結(jié) 語

        數(shù)據(jù)驅(qū)動的基于規(guī)則的專家知識資源建模及獲取技術(shù),能通過數(shù)據(jù)本身相關(guān)的規(guī)則進行推理,實現(xiàn)智能化獲取數(shù)據(jù)的方式,減少人工編輯工作量。并且,數(shù)據(jù)的多源性使得獲取知識多樣性,滿足知識的個性化要求,并快速地為企業(yè)提供合理的配置專家作準(zhǔn)備工作,在業(yè)務(wù)問題求解方面提高效率,將數(shù)據(jù)可視化,為業(yè)務(wù)人員在求解過程中提供參考。

        猜你喜歡
        規(guī)則資源信息
        撐竿跳規(guī)則的制定
        基礎(chǔ)教育資源展示
        數(shù)獨的規(guī)則和演變
        一樣的資源,不一樣的收獲
        資源回收
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        TPP反腐敗規(guī)則對我國的啟示
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        a级三级三级三级在线视频| 伊人99re| 人妻少妇精品无码系列| 亚洲av一二三四五区在线| 无码熟妇人妻av在线网站 | 男女性高爱潮免费网站| 人妻少妇不满足中文字幕| 国产肥熟女视频一区二区三区| 日韩av一区二区不卡| av鲁丝一区鲁丝二区鲁丝三区| 久久tv中文字幕首页| 久久亚洲精彩无码天堂| 日韩中文字幕不卡在线| 少妇中文字幕乱码亚洲影视| 久久精品国产亚洲av高清色欲| 亚洲中文字幕无码不卡电影| 国产精品熟女视频一区二区三区 | 久久精品免费无码区| 少妇人妻中文字幕在线| 夫妻免费无码v看片| 久久精品人人爽人人爽| 亚欧乱色束缚一区二区三区| 女主播啪啪大秀免费观看| 少妇被粗大的猛进出69影院 | 99久久免费只有精品国产| 最新亚洲人成无码网站| 日韩精品人妻中文字幕有码| 91久久偷偷做嫩模影院| 国产精品 人妻互换| 激情五月天伊人久久| 亚洲中文字幕乱码免费看| 日本丰满老妇bbw| 国产在线观看免费观看| 久久久久久人妻一区精品| 风韵人妻丰满熟妇老熟| 久久久久亚洲av无码专区首jn| 人妻少妇精品无码专区二| 91国产视频自拍在线观看| 色窝窝无码一区二区三区| 亚洲国产精品久久久久秋霞1| 国产男女做爰猛烈视频网站|