楊志明,張征容,易亮,李寶福
(1. 云南電網(wǎng)有限責(zé)任公司玉溪供電局,云南 玉溪 653100;2. 云南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,昆明 650217)
隨著電力自動(dòng)化和信息化的發(fā)展,配電網(wǎng)設(shè)備的智能化管控、運(yùn)檢日漸成熟,且各地區(qū)電網(wǎng)公司也都初步建立起了對(duì)配電網(wǎng)設(shè)備進(jìn)行監(jiān)控和管理的信息平臺(tái),實(shí)現(xiàn)了對(duì)配電網(wǎng)設(shè)備跨專業(yè)、多場(chǎng)景的管控。但伴隨經(jīng)濟(jì)社會(huì)的不斷發(fā)展,現(xiàn)有配電網(wǎng)的運(yùn)維管理水平難以滿足用戶日益增長(zhǎng)的用電服務(wù)需求[1]。
國內(nèi)外卻缺少以配電網(wǎng)運(yùn)檢知識(shí)服務(wù)為角度的研究,缺少線上化、智能化、專業(yè)化的配電網(wǎng)運(yùn)檢知識(shí)服務(wù)體系。目前對(duì)于配電網(wǎng)運(yùn)檢知識(shí)服務(wù)還停留在業(yè)內(nèi)教授、線下專業(yè)期刊雜志(如:電工研究)、線上電力資訊網(wǎng)站(如:北極星電力網(wǎng))等模式。但通過業(yè)內(nèi)教授、線下期刊、資訊網(wǎng)站等模式,配電網(wǎng)運(yùn)檢知識(shí)散布、普及度不高。
大部分配電網(wǎng)設(shè)備初級(jí)運(yùn)檢人員對(duì)配電網(wǎng)設(shè)備的日常維護(hù)與檢修不熟悉,無法適應(yīng)配電網(wǎng)故障場(chǎng)景的變化,有些甚至無從下手,且專業(yè)人員也對(duì)配電網(wǎng)設(shè)備的運(yùn)檢知識(shí)獲取渠道局限、獲取維度小,市面上也沒有適應(yīng)目前國內(nèi)電力系統(tǒng)專業(yè)、統(tǒng)一、官方的具有全方面指導(dǎo)價(jià)值的知識(shí)體系。
配電網(wǎng)運(yùn)檢場(chǎng)景眾多、錯(cuò)綜復(fù)雜,且配電網(wǎng)運(yùn)檢知識(shí)渠道局限。針對(duì)上述問題,本文將以提問傾向性預(yù)測(cè)、知識(shí)庫處理和相似度匹配為研究方向,基于提供配電網(wǎng)運(yùn)檢人員知識(shí)獲取渠道的需求建立配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型,實(shí)現(xiàn)配電網(wǎng)運(yùn)檢知識(shí)問答。
本文所研究設(shè)計(jì)的配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型最終是要實(shí)現(xiàn)基于配電網(wǎng)運(yùn)檢知識(shí)庫的問答服務(wù),其本質(zhì)是一個(gè)知識(shí)庫問答(如圖1所示)。知識(shí)庫問答主要是通過對(duì)提出問題進(jìn)行語義理解和分析,進(jìn)而利用知識(shí)庫進(jìn)行查詢、推理來得出答案。該知識(shí)庫也是基于三元組的關(guān)系,所回答的答案也主要是知識(shí)庫中的實(shí)體和實(shí)體關(guān)系,否則便是無答案。目前其實(shí)現(xiàn)的主要方法有語義解析、信息抽取和向量建模。
基于三元組的思想建立知識(shí)庫,通過對(duì)配電網(wǎng)運(yùn)檢人員提出問題的語義解析和信息提取對(duì)問題-答案對(duì)進(jìn)行向量建模,找出最佳答案。通過對(duì)三元組知識(shí)庫、語義解析、信息抽取和向量建模等四個(gè)模塊的建立,實(shí)現(xiàn)配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型。
知識(shí)庫顧名思義便是存儲(chǔ)一條一條知識(shí)的地方。對(duì)于配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)來說,“爐管泄露報(bào)警處理”便是一條知識(shí),配電網(wǎng)運(yùn)檢知識(shí)庫便是存儲(chǔ)這樣一條一條知識(shí)的地方。但對(duì)于計(jì)算機(jī)來說,這樣的自然語言文本是不易理解和處理的,于是,為了使計(jì)算機(jī)能夠更加便捷的去理解和處理,就需要將這些自然語句轉(zhuǎn)化為計(jì)算機(jī)方便理解、處理的形式,三元組便是很好的一個(gè)選擇。
三元組可以表示為(實(shí)體,關(guān)系,實(shí)體),其中關(guān)系可以是實(shí)體的屬性,也可以是實(shí)體間的關(guān)系。例如爐管泄露報(bào)警處理便可表示為(爐管泄露報(bào)警,處理,處理知識(shí))和(爐管泄露報(bào)警,設(shè)備的處理方式,處理知識(shí)),其中第一個(gè)三元組中的處理便是屬性,第二個(gè)三元組中的設(shè)備的處理方式便是關(guān)系。對(duì)于計(jì)算機(jī)來說,這兩種表示方式皆方便其理解、處理。
進(jìn)一步的,如果將三元組中的實(shí)體看作一個(gè)節(jié)點(diǎn),實(shí)體關(guān)系看作邊,那么大量包含三元組的知識(shí)庫便成為了一個(gè)知識(shí)網(wǎng),如圖2所示。
知識(shí)庫主要涉及到實(shí)體鏈指和關(guān)系抽取這兩大技術(shù)。其中,實(shí)體鏈指就是將文檔里面實(shí)體的名字與知識(shí)庫里面相對(duì)應(yīng)的實(shí)體進(jìn)行鏈接。它主要涉及到了自然語言處理的兩個(gè)方法:實(shí)體識(shí)別與實(shí)體消歧,除了將文檔中的實(shí)體識(shí)別出來,在不同環(huán)境下同一實(shí)體名稱可能也會(huì)存在歧義,如線路、報(bào)警等,此時(shí)還需要根據(jù)上下文環(huán)境進(jìn)行消歧。關(guān)系抽取就是將文檔中的實(shí)體關(guān)系給抽取出來,主要涉及到了語義分析、依存關(guān)系樹等,同時(shí)還要構(gòu)建SVM、最大熵模型等分類器來進(jìn)行關(guān)系分類。
圖2 知識(shí)網(wǎng)絡(luò)圖示
語義解析的主體思想就是將自然語言轉(zhuǎn)化為一系列形式化的邏輯形式,通過將邏輯形式進(jìn)行自底向上的解析,就可以得到一種表達(dá)問題語義的邏輯形式,最后再用相應(yīng)的查詢語句在配電網(wǎng)運(yùn)檢知識(shí)庫中進(jìn)行查詢,從而得出答案。
圖3 語義解析圖示[3]
在配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)的過程中,第一個(gè)難點(diǎn)就是如何將問題映射到知識(shí)庫里的相關(guān)知識(shí)。語義解析在此時(shí)就是將表述問題的自然語言進(jìn)行語義分析,轉(zhuǎn)化成一種知識(shí)庫可以理解的語義表示,再通過知識(shí)庫中的知識(shí)來進(jìn)行推理和查詢,得出答案。簡(jiǎn)而言之,語義解析要做的事情,就是將自然語言轉(zhuǎn)化成知識(shí)庫可以理解的邏輯形式。如果將知識(shí)庫比作數(shù)據(jù)庫,邏輯形式就是sql語句。
圖3示紅色部分即邏輯形式,綠色部分為用自然語言提出的問題,藍(lán)色部分為進(jìn)行語義解析的相關(guān)操作,最終形成的語義解析樹根節(jié)點(diǎn)就是語義解析的結(jié)果,通過查詢語句就可以直接在配電網(wǎng)運(yùn)檢知識(shí)庫中查詢到最終答案。
信息抽取就是通過提取配電網(wǎng)運(yùn)檢人員問題中的實(shí)體,再在配電網(wǎng)運(yùn)檢知識(shí)庫中查詢以該實(shí)體節(jié)點(diǎn)為中心的知識(shí)庫子圖,同時(shí),子圖中的每一個(gè)節(jié)點(diǎn)或邊都可以作為候選的答案,然后依據(jù)某些規(guī)則或模板對(duì)配電網(wǎng)運(yùn)檢人員問題進(jìn)行信息抽取,得到問題特征向量,最終通過向量建模模塊來對(duì)候選答案進(jìn)行篩選,從而返回最終答案。
在信息提取方面,使用語義依存樹來自然語言進(jìn)行處理,提取其中的實(shí)體。主要是通過語義依存樹的依存關(guān)系來推斷出問題的關(guān)鍵實(shí)體和關(guān)鍵實(shí)體的屬性、范圍等,從而達(dá)到提取關(guān)鍵信息的效果,找出有利于尋找答案的問題特征,刪減掉不重要的信息。
在問題特征向量方面,使用二分類的思路,訓(xùn)練問題-答案對(duì)數(shù)據(jù),通過分類器的訓(xùn)練找到正確答案。而問題-答案對(duì)便是特征向量的實(shí)質(zhì),特征向量中的每一維便對(duì)應(yīng)一個(gè)問題-候選答案特征。每一個(gè)問題-候選答案特征都由問題特征中的一個(gè)特征,和候選答案特征的一個(gè)特征,組合而成。
向量建模的思想基于信息抽取模塊,根據(jù)問題得出候選答案,把問題和候選答案映射為分布式表達(dá),再通過訓(xùn)練使得問題和正確答案的向量表達(dá)盡可能的準(zhǔn)確。模型訓(xùn)練完成后則可根據(jù)候選答案的向量表達(dá)和問題表達(dá)的得分進(jìn)行篩選,得出最終答案。
在問題的分布式表達(dá)方面,首先把自然語言問題進(jìn)行向量化,將輸入空間的維度N設(shè)置為字典的大小+知識(shí)庫實(shí)體數(shù)目+知識(shí)庫實(shí)體關(guān)系數(shù)目,對(duì)于輸入向量每一維的值設(shè)置為該維所代表的單詞在問題中出現(xiàn)的次數(shù)。那么,如果用q代表問題,用φ(q)代表N維的問題向量,用矩陣W將N維的問題向量映射到k維的低維空間,那么問題的分布式表達(dá)即:
在答案的分布式表達(dá)方面,與問題的分布式表達(dá)相同,如果用a表示答案,用φ(a)代表答案的輸入向量,用矩陣W將N維的問題向量映射到k維的低維空間,那么答案的分布式表達(dá)即:
最后,在向量得分方面,希望問題和它所對(duì)應(yīng)的正確答案得分盡量高,通過比較每個(gè)候選答案的得分,選出最高的,作為正確答案。那么得分函數(shù)便可定義為二者分布式表達(dá)的點(diǎn)乘,即:
圖4 電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型實(shí)現(xiàn)流程
在對(duì)大量的研究成果、問答系統(tǒng)常用實(shí)現(xiàn)方法進(jìn)行研究后,本文所設(shè)計(jì)的配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型將采用基于知識(shí)庫的問答思路并作出改進(jìn),參考信息抽?。↖nformation Extraction)的思路,實(shí)現(xiàn)配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)。在實(shí)驗(yàn)階段先將北極星電力網(wǎng)(http://www.bjx.com.cn/)中運(yùn)檢知識(shí)手動(dòng)進(jìn)行挑選、并處理為問題+答案的內(nèi)容作為知識(shí)庫并進(jìn)行相關(guān)處理,隨后,對(duì)配電網(wǎng)運(yùn)檢人員提出的問題進(jìn)行關(guān)鍵詞提取,再通過編輯距離算法(Levenshtein Distance)對(duì)配電網(wǎng)運(yùn)檢人員提出問題和知識(shí)庫中的問題進(jìn)行字符串匹配,找到相似度最高的知識(shí)庫問題,返回其對(duì)應(yīng)的答案,最后通過多次問答的積累,基于提問傾向性預(yù)測(cè),提升配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的準(zhǔn)確度。其實(shí)現(xiàn)流程如圖4所示。
配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型中關(guān)鍵詞的提取主要是基于TF-IDF算法,TF-IDF即詞頻(TF)和逆文檔頻率(IDF),通過在文本中關(guān)鍵詞出現(xiàn)的頻率的基礎(chǔ)上對(duì)每個(gè)詞賦予一個(gè)重要性的權(quán)重,對(duì)較常見的詞分配較小的權(quán)重,不常見的詞分配較大的權(quán)重,從一定程度上保證最終找到的關(guān)鍵詞不受常見詞干擾,這個(gè)權(quán)重就是逆文檔頻率。記某個(gè)詞在文本中出現(xiàn)的次數(shù)為i,文本的總詞數(shù)為I,配電網(wǎng)運(yùn)檢知識(shí)庫中的文檔總數(shù)為W,配電網(wǎng)運(yùn)檢知識(shí)庫中包含該詞的文檔數(shù)為W(i),則TF-IDF計(jì)算方法如下:
TF-IDF與一個(gè)詞在文本中出現(xiàn)的次數(shù)成正比,與該詞在整個(gè)配電網(wǎng)運(yùn)檢知識(shí)庫環(huán)境出現(xiàn)的次數(shù)成反比,它能有效的反映出一段文本中的關(guān)鍵詞。配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型將采用TFIDF值最高的三個(gè)關(guān)鍵詞與知識(shí)庫中的問題和答案進(jìn)行匹配。
配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型主要基于編輯距離算法(Levenshtein Distance)進(jìn)行改進(jìn)來實(shí)現(xiàn)提問關(guān)鍵詞與配電網(wǎng)運(yùn)檢知識(shí)庫中問題的匹配。編輯距離算法,是指在兩個(gè)字符串之間,將其中一個(gè)字符串轉(zhuǎn)變?yōu)榱硪粋€(gè)字符串所需要的最少編輯的操作次數(shù),其中許可的編輯操作包括替換字符,插入字符和刪除字符,一般來說,編輯距離越小,相似度就越大。
以中文語句舉例來表示編輯操作:根據(jù)配電網(wǎng)運(yùn)檢人員提出問題所提取出來的關(guān)鍵詞組“爐管,泄露,報(bào)警”與“爐管泄露報(bào)警處理方式”就需要兩次刪除“,”的操作和分別四次加入“處”、“理”、“方”、“式”的操作,共6次操作,其編輯距離為6;若關(guān)鍵詞組為“爐管,泄露”就需要一次刪除“,”的操作和分別6次加入“報(bào)”、“警”、“處”、“理”、“方”、“式”的操作,共7次操作,其編輯距離為7。此時(shí)第一個(gè)的編輯距離比第二個(gè)的編輯距離低,同時(shí)也能很明顯的看出第一個(gè)關(guān)鍵詞組和配電網(wǎng)運(yùn)檢知識(shí)庫問題的相似度比第二個(gè)關(guān)鍵詞組的高。
s為編輯距離,兩個(gè)字符串長(zhǎng)度分別為L(zhǎng)(a),L(b)。一般來說,根據(jù)編輯距離的相似度算法如下所示。
但上述算法還是不夠簡(jiǎn)潔、輕便,從上式來看,相似度是由完全長(zhǎng)度范圍減去編輯距離所占的長(zhǎng)度范圍,那便可直接引入非編輯距離,即無需變動(dòng)的字符串長(zhǎng)度。記非編輯距離為S,此時(shí)的相似度算法為:
基于上述相似度算法,將相似度最高的配電網(wǎng)運(yùn)檢知識(shí)問題所對(duì)應(yīng)的答案返回,得出配電網(wǎng)運(yùn)檢人員提問的最終答案。
無論是對(duì)某種設(shè)備類別的運(yùn)檢知識(shí)傾向,還是對(duì)某種故障類別的運(yùn)檢知識(shí)傾向,皆表明了配電網(wǎng)運(yùn)檢人員最有可能想要提出的問題方向,為了提升配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)的效率和準(zhǔn)確度,基于SnowNIP算法的思路,對(duì)配電網(wǎng)運(yùn)檢人員的提問進(jìn)行情感傾向性的分析。通過提問傾向性預(yù)測(cè)的建立,可在配電網(wǎng)運(yùn)檢人員提問時(shí)首先對(duì)配電網(wǎng)運(yùn)檢人員的提問傾向進(jìn)行預(yù)測(cè),將傾向性高的配電網(wǎng)運(yùn)檢知識(shí)問題優(yōu)先匹配,進(jìn)而提升配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)的效率和準(zhǔn)確度。
首先建立貝葉斯模型,將配電網(wǎng)運(yùn)檢人員每次提出的問題作為訓(xùn)練數(shù)據(jù)進(jìn)行分詞和停詞處理來統(tǒng)計(jì)詞頻,進(jìn)而形成一個(gè)正面詞(詞頻高的詞)字典和一個(gè)負(fù)面詞(詞頻低的詞)字典,最后再利用貝葉斯模型進(jìn)行提問傾向性預(yù)測(cè)。
提問傾向性預(yù)測(cè)實(shí)現(xiàn)流程如圖5所示。
圖5 提問傾向性預(yù)測(cè)實(shí)現(xiàn)流程
2.3.1 貝葉斯模型
在配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)的提問傾向性預(yù)測(cè)中,情感分類的基本模型便是貝葉斯模型,貝葉斯模型都是利用條件概率來進(jìn)行提問傾向分類的。例如,有一個(gè)問題需要判斷是日常運(yùn)維還是故障修理,該問題提取出三個(gè)關(guān)鍵詞,若將運(yùn)檢類別記為X(i),三個(gè)關(guān)鍵詞分別記為a、b、c,則需要分別求解這三個(gè)關(guān)鍵詞屬于每個(gè)運(yùn)檢類別的條件概率,其算法如下所示。
由于特征之間是相互獨(dú)立的,所以:P(a,b,c│X(i))=P(a│X(i))P(b│X(i))P(c│X(i))
此時(shí),X(i)便是提問傾向類別。在配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型中,基于貝葉斯模型將提問傾向分為兩個(gè)類別,一類是正面詞,一類是負(fù)面詞,即X(i)中的i=2。
2.3.2 樸素貝葉斯預(yù)測(cè)
樸素貝葉斯中的樸素是指特征條件獨(dú)立假設(shè),貝葉斯則是指貝葉斯定理。貝葉斯定理中最為重要的先驗(yàn)概率(prior probability)和后驗(yàn)概率的概念便能很好的應(yīng)用在提問傾向性的分析中。其中,事情還沒有發(fā)生,要求這件事情發(fā)生的可能性大小是先驗(yàn)概率;若是事情已經(jīng)發(fā)生,要求這件事情發(fā)生的原因是由某個(gè)因素引起的可能性的大小,是后驗(yàn)概率[5]。樸素貝葉斯預(yù)測(cè),便是根據(jù)正面詞庫的先驗(yàn)概率判斷配電網(wǎng)運(yùn)檢人員的提問傾向。若記正面詞庫的先驗(yàn)概率為P(pos),當(dāng)前要判斷傾向的句子是x,它由關(guān)鍵詞組[a,b,c]組成,其算法如下所示。
由上式可知,當(dāng)配電網(wǎng)運(yùn)檢人員提出問題時(shí),若是其關(guān)鍵詞在正面詞庫的概率越大,便可優(yōu)先檢索正面詞庫里的配電網(wǎng)運(yùn)檢知識(shí)。
使用30組模型返回答案-常規(guī)答案實(shí)例對(duì)配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型進(jìn)行查全率(Recall)和查準(zhǔn)率(Precision)計(jì)算,其中常規(guī)答案是指配電網(wǎng)專業(yè)運(yùn)檢人員在運(yùn)檢日常中碰到問題時(shí)會(huì)找的答案。一般來說,查準(zhǔn)率和查全率這兩個(gè)指標(biāo)相互矛盾,當(dāng)查準(zhǔn)率高的時(shí)候,查全率低;查全率高時(shí),查準(zhǔn)率低,所以將運(yùn)用F1度量最終判斷配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的性能。但由于配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的應(yīng)用環(huán)境,查準(zhǔn)率與查全率這兩個(gè)指標(biāo)并不矛盾,皆是越高模型實(shí)現(xiàn)效果越好,故此處對(duì)兩者進(jìn)行點(diǎn)乘處理,結(jié)果越接近1,模型實(shí)現(xiàn)效果越好。模型返回答案-常規(guī)答案實(shí)例如表1所示,30組測(cè)試實(shí)例情況統(tǒng)計(jì)表如表2所示。
表1 模型返回答案-常規(guī)答案實(shí)例(節(jié)選)
表2 30組測(cè)試實(shí)例情況統(tǒng)計(jì)表
根據(jù)這30組測(cè)試實(shí)例情況統(tǒng)計(jì)結(jié)果,對(duì)配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型進(jìn)行查全率計(jì)算:
對(duì)配電網(wǎng)運(yùn)檢知識(shí)進(jìn)行查準(zhǔn)率計(jì)算:
對(duì)查全率與查準(zhǔn)率進(jìn)行綜合分析,得出綜合評(píng)價(jià)分?jǐn)?shù)G:
基于這30組測(cè)試實(shí)例,總的來看本文所設(shè)計(jì)的配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型實(shí)現(xiàn)效果良好。但從性能來看,該配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型基于對(duì)配電網(wǎng)運(yùn)檢知識(shí)庫的遍歷檢索,雖然對(duì)配電網(wǎng)運(yùn)檢知識(shí)庫進(jìn)行了三元組處理和答案提煉成問題的處理方式,但實(shí)現(xiàn)問答匹配的方法效率較低,還有改進(jìn)和發(fā)展的空間。
經(jīng)過對(duì)配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型設(shè)計(jì)的深入思考,結(jié)合國內(nèi)外研究現(xiàn)狀,認(rèn)為谷歌的PageRank算法思路可以有效的提高現(xiàn)有配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的問答匹配效率和準(zhǔn)確率。
PageRank算法總的來說就是預(yù)先給每個(gè)配電網(wǎng)運(yùn)檢知識(shí)庫中的知識(shí)一個(gè)PR值(PageRank值),由于PR值物理意義上為一條知識(shí)被返回的概率,所以一般是其中N為配電網(wǎng)運(yùn)檢知識(shí)庫中知識(shí)的總數(shù)。預(yù)先給定PR值后,再通過特定的算法不斷迭代訓(xùn)練,直至達(dá)到每一條知識(shí)的PR值平穩(wěn)分布為止。進(jìn)而通過PR值的大小來決定配電網(wǎng)運(yùn)檢知識(shí)庫中每條知識(shí)匹配的優(yōu)先級(jí),PR值越高則優(yōu)先級(jí)越高。
可將配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型中現(xiàn)有的提問傾向性預(yù)測(cè)方法與PageRank算法進(jìn)行有效結(jié)合,進(jìn)而提升配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的效率與準(zhǔn)確率。
本文從配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型相關(guān)技術(shù)及文獻(xiàn)研究開始,找到并深入研究了幾個(gè)配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的設(shè)計(jì)與實(shí)現(xiàn)方向,最終確定了將運(yùn)檢知識(shí)手動(dòng)進(jìn)行挑選、并處理為問題+答案的內(nèi)容作為知識(shí)庫;對(duì)配電網(wǎng)運(yùn)檢人員提出的問題進(jìn)行關(guān)鍵詞提??;通過編輯距離算法(Levenshtein Distance)對(duì)配電網(wǎng)運(yùn)檢人員提出問題和知識(shí)庫中的問題進(jìn)行字符串匹配,找到相似度最高的知識(shí)庫問題,返回其對(duì)應(yīng)的答案;通過多次問答的積累,基于提問傾向性預(yù)測(cè),提升配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的效率及準(zhǔn)確度的設(shè)計(jì)路線。最終實(shí)現(xiàn)了基于配電網(wǎng)運(yùn)檢知識(shí)服務(wù)模型的配電網(wǎng)運(yùn)檢知識(shí)問答服務(wù)。本模型的設(shè)計(jì)也對(duì)配電網(wǎng)運(yùn)檢服務(wù)提供出了知識(shí)服務(wù)的思路。同時(shí),本模型的設(shè)計(jì)同樣適用于其他領(lǐng)域知識(shí)問答服務(wù),通過本文設(shè)計(jì)思路,讓知識(shí)問答簡(jiǎn)單、明了。