閻笑彤,徐 翔,郭顯久、2,孫凱樂
(1.大連海洋大學(xué)信息工程學(xué)院,遼寧大連116023;2.遼寧省海洋信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,遼寧大連116023)
?
基于WEB的水產(chǎn)養(yǎng)殖病害診斷專家系統(tǒng)
閻笑彤1,徐翔1,郭顯久1、2,孫凱樂1
(1.大連海洋大學(xué)信息工程學(xué)院,遼寧大連116023;2.遼寧省海洋信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,遼寧大連116023)
摘要:為解決水產(chǎn)養(yǎng)殖中的病害問題,采用TFIDF加權(quán)算法和動態(tài)規(guī)劃的設(shè)計(jì)理念,結(jié)合余弦相似度模型,設(shè)計(jì)并實(shí)現(xiàn)了基于WEB的水產(chǎn)養(yǎng)殖病害診斷專家系統(tǒng)。該系統(tǒng)包括專家診斷模塊、查詢模塊、瀏覽模塊和專家在線更新模塊,能自動對用戶輸入癥狀進(jìn)行關(guān)鍵詞提取并通過TFIDF算法加權(quán),然后采用余弦相似度模型公式計(jì)算,得出輸入文本與知識庫中每篇文檔的相似度,最后把相似度高的前3個(gè)疾病及其治療方案作為診斷結(jié)果反饋給用戶。經(jīng)實(shí)驗(yàn)驗(yàn)證,該系統(tǒng)可以快速地對用戶輸入的病害癥狀進(jìn)行正確診斷,可用于水產(chǎn)養(yǎng)殖生產(chǎn)實(shí)踐中。
關(guān)鍵詞:水產(chǎn)養(yǎng)殖;病害診斷;專家系統(tǒng);知識庫
專家系統(tǒng)作為信息技術(shù)的分支,在農(nóng)業(yè)系統(tǒng)中已得到了廣泛應(yīng)用[1],如花卉病害診斷專家系統(tǒng)[2]、水稻病蟲害診斷專家系統(tǒng)[3]、果樹病害診斷專家系統(tǒng)[4]、蔬菜作物病害診斷專家系統(tǒng)[5]等。而水產(chǎn)養(yǎng)殖業(yè)作為農(nóng)業(yè)的重要組成部分,對于信息技術(shù)的應(yīng)用雖然起步較晚但發(fā)展迅速,如海參養(yǎng)殖專家系統(tǒng)[6]、對蝦病害診斷專家系統(tǒng)[7]等。隨著高密度、工廠化、集約化水產(chǎn)養(yǎng)殖模式的建立與推廣,水產(chǎn)養(yǎng)殖病害問題日趨嚴(yán)重,因此,建立基于互聯(lián)網(wǎng)的多種水產(chǎn)養(yǎng)殖病害專家系統(tǒng)具有重要意義。本研究中,設(shè)計(jì)并實(shí)現(xiàn)了基于WEB的水產(chǎn)養(yǎng)殖病害診斷專家系統(tǒng),旨在為水產(chǎn)養(yǎng)殖中的病害問題提供快速診斷和解決方案。
1.1 系統(tǒng)目標(biāo)
本系統(tǒng)以實(shí)用性為原則,通過分析用戶需求來制定相應(yīng)的系統(tǒng)目標(biāo),系統(tǒng)應(yīng)達(dá)到:(1)快速、準(zhǔn)確、可靠的專家診斷功能;(2)支持多媒體格式,如圖片、視頻等;(3)用戶可進(jìn)行線上留言以及文件上傳;(4)專家可對數(shù)據(jù)庫進(jìn)行在線更新、刪除等操作。
1.2 系統(tǒng)架構(gòu)
本系統(tǒng)采用瀏覽器/WEB服務(wù)器/數(shù)據(jù)庫的3 層 B/S架構(gòu),基于 Servlet和 JSP技術(shù)[8-9],以Tomcat為服務(wù)器、MySQL為數(shù)據(jù)庫系統(tǒng),系統(tǒng)結(jié)構(gòu)如圖1所示。
1.3 系統(tǒng)的功能模塊
水產(chǎn)養(yǎng)殖病害診斷專家系統(tǒng)包括4個(gè)模塊:專家診斷模塊、查詢模塊、瀏覽模塊、專家在線更新模塊 (圖2)。其中:專家診斷模塊是系統(tǒng)的主體,可通過啟發(fā)式輸入,把信息匯總到服務(wù)器,服務(wù)器對信息進(jìn)行處理并最后返回給用戶診斷結(jié)果;查詢模塊提供站內(nèi)文檔主題的模糊檢索功能;瀏覽模塊可以瀏覽水產(chǎn)養(yǎng)殖病害的圖片、視頻,以及常見藥物的使用方法等詳細(xì)信息;專家在線更新模塊是一個(gè)知識庫維護(hù)模塊,可由授權(quán)專家進(jìn)行數(shù)據(jù)庫的在線自動更新、刪除、修改、查看用戶留言和文件上傳等操作,通過此模塊可實(shí)現(xiàn)專家系統(tǒng)知識的不斷積累。
1.4 數(shù)據(jù)庫的設(shè)計(jì)
本系統(tǒng)的知識庫由4個(gè)主要數(shù)據(jù)庫組成,分別為病癥庫、關(guān)鍵詞庫、權(quán)重值矩陣庫和參數(shù)矩陣庫。
圖1 系統(tǒng)結(jié)構(gòu)圖Fig.1 Schematic view of the system structure
圖2 系統(tǒng)模塊結(jié)構(gòu)圖Fig.2 M odule structure diagram of the system
病癥庫是用來存儲疾病的詳細(xì)信息,包括名稱、水產(chǎn)品種類、病原、癥狀和治療方法,部分顯示如表1所示。
表1 病癥庫 (部分)Tab.1 Disease Database(partial)
關(guān)鍵詞庫是用來存放疾病癥狀的關(guān)鍵詞。專家在更新或者插入病癥的時(shí)候會標(biāo)記出每條疾病癥狀的關(guān)鍵詞,系統(tǒng)根據(jù)標(biāo)記可自動更新或者增加關(guān)鍵詞庫。每條疾病會對應(yīng)關(guān)鍵詞庫中的所有關(guān)鍵詞,當(dāng)關(guān)鍵詞并不存在于疾病癥狀中時(shí),權(quán)值默認(rèn)為0,故病癥和關(guān)鍵詞是1對多的關(guān)系。
權(quán)重值矩陣庫是用來存放不同疾病對應(yīng)的不同關(guān)鍵詞的權(quán)重值。權(quán)重值矩陣庫的結(jié)構(gòu)為 disid(主鍵,對應(yīng)病癥庫ID),wordid(主鍵,對應(yīng)關(guān)鍵詞庫ID),weight(當(dāng)前疾病詞匯所對應(yīng)的權(quán)重值)。因?yàn)榧膊『完P(guān)鍵詞為1對多的關(guān)系,所以disid、wordid作為共同主鍵的同時(shí),又分別與病癥庫的病癥ID、關(guān)鍵詞庫的關(guān)鍵詞ID構(gòu)成外鍵關(guān)聯(lián),如圖3所示。
圖3 權(quán)重值矩陣結(jié)構(gòu)圖Fig.3 M atrix of weighted value graph
病癥庫、關(guān)鍵詞庫、權(quán)重值矩陣庫3個(gè)庫形成一個(gè)關(guān)聯(lián),病癥庫中每一條疾病的癥狀都會對應(yīng)關(guān)鍵詞庫中的所有關(guān)鍵詞,而每個(gè)關(guān)鍵詞均會對應(yīng)一個(gè)權(quán)重值,由此形成一個(gè)列數(shù)為3(第一列對應(yīng)疾病,第二列對應(yīng)關(guān)鍵詞,第3列對應(yīng)權(quán)重值),行數(shù)為疾病數(shù)×關(guān)鍵詞數(shù)的矩陣,根據(jù)不同的疾病所構(gòu)成的關(guān)鍵詞矩陣可以對不同的疾病進(jìn)行標(biāo)識和區(qū)分。
參數(shù)矩陣庫是用來為計(jì)算權(quán)重值提供參數(shù)數(shù)據(jù)支持。參數(shù)矩陣庫也以病癥ID和關(guān)鍵詞ID為共同主鍵,并分別與疾病庫ID、關(guān)鍵詞庫ID形成外鍵關(guān)聯(lián),在計(jì)算權(quán)重值時(shí)需要用到一個(gè)參數(shù),即每個(gè)關(guān)鍵詞在不同的文章中出現(xiàn)的次數(shù),將此參數(shù)儲存在這里,計(jì)算時(shí)方便調(diào)取。
病癥庫、關(guān)鍵詞庫、權(quán)重值矩陣庫和參數(shù)矩陣庫的關(guān)聯(lián)關(guān)系如圖4所示。
圖4 病癥庫、關(guān)鍵詞庫、權(quán)重值矩陣庫、參數(shù)矩陣庫實(shí)體-聯(lián)系 (ER)圖Fig.4 ER draw ing of disease library,keyword lib rary,matrix of weighted value library and matrix of parameter
2.1 知識的獲取
知識獲取就是把問題求解的專門知識從專家頭腦中和其他知識源中提煉出來,并按照一種合適的知識表示方法將其轉(zhuǎn)移到計(jì)算機(jī)中[10]。本系統(tǒng)通過人工和自動兩種方式獲取知識:一是與領(lǐng)域?qū)<疫M(jìn)行合作,通過網(wǎng)絡(luò)、期刊和專業(yè)書籍獲得初步的水產(chǎn)養(yǎng)殖病害診療知識,在對知識歸納、整理后初步建立知識庫;另一種是通過在線開放的形式獲取知識,授權(quán)專家登錄網(wǎng)站,通過輸入病害知識和關(guān)鍵詞進(jìn)行知識庫的在線自動更新,通過這種方式對專家系統(tǒng)提供豐富的知識庫支持。
因?yàn)楸鞠到y(tǒng)基于開放網(wǎng)絡(luò),用戶可以通過網(wǎng)絡(luò)隨時(shí)提出各種關(guān)于水產(chǎn)疾病的問題,或者上傳與疾病相關(guān)的文件。授權(quán)專家會定期登陸系統(tǒng)在線更新模塊,一方面可以查看用戶留言以及上傳的文件,通過審批將有價(jià)值的內(nèi)容增加到數(shù)據(jù)庫中,同時(shí)在公告欄對用戶的問題進(jìn)行回答;另一方面,專家可以通過使用系統(tǒng)的在線更新模塊,對病癥庫、關(guān)鍵詞庫,以及各種知識文檔、圖片、視頻進(jìn)行添加(詳見 “3.3”節(jié))。目前,通過這種方式已將100篇用于測試疾病的數(shù)據(jù)信息插入到病癥庫中。
2.2 知識的表示
知識表示是為描述世界所做的一組約定,是知識的符號化、形式化、模型化[11]。本系統(tǒng)知識表示模型如圖5所示。系統(tǒng)首先對輸入癥狀進(jìn)行分詞比對,然后計(jì)算詞的權(quán)重,再通過相似度比對得出診斷結(jié)果。
圖5 知識表示模型Fig.5 Know ledge represen tation model
3.1 專家診斷功能
界面使用啟發(fā)式的病癥輸入,加入分好類(海參、鮑魚、龍蝦、海膽、甲魚等)的常見癥狀描述集合,用戶可以通過復(fù)選框選擇詞匯和文本框輸入病癥進(jìn)行共同描述癥狀,提升診斷的準(zhǔn)確性。當(dāng)用戶提交后,服務(wù)器會對接收到的癥狀進(jìn)行分詞。本研究中,采用的分詞方法借鑒了文獻(xiàn) [12]中的方法,基本過程如圖6所示。
圖6 分詞過程Fig.6 Words processing
圖6中,Q為正則表達(dá)式提取結(jié)果。若Q的字?jǐn)?shù)大于4個(gè)漢字,則截取前4個(gè)漢字 (以temp表示),若小于4個(gè)漢字,則取全部,因?yàn)殛P(guān)鍵詞的選取在4個(gè)漢字之內(nèi),故選擇截取4個(gè)漢字,然后與關(guān)鍵詞庫內(nèi)容進(jìn)行對比,若相同則加入結(jié)果容器并跳出本次循環(huán),同時(shí)將Q從左去掉此時(shí)temp的字?jǐn)?shù),繼續(xù)下次循環(huán);若無相同,則依次去掉temp中的最后一個(gè)漢字后再對比,直到temp字?jǐn)?shù)為1時(shí)跳出本次循環(huán),將Q從左邊去掉1個(gè)漢字,再進(jìn)行上述過程,Q字?jǐn)?shù)為0時(shí)結(jié)束分詞。通過這種分詞方法可實(shí)現(xiàn)正向匹配和逆向匹配,將輸入癥狀和庫中匹配的詞選出。
以海參盾纖毛蟲病為例,當(dāng)用戶輸入 “當(dāng)稚參活力弱時(shí),在顯微鏡下可見纖毛蟲攻擊參體造成創(chuàng)口后,致使海參幼體解體死亡。經(jīng)鑒定為盾纖毛蟲類,嗜污科,種名待定。纖毛蟲活體外觀呈瓜子形,皮膜薄,無缺刻,該病多由細(xì)菌和纖毛蟲協(xié)同致病。首先,先由細(xì)菌感染致使稚參活力減弱,然后遭到纖毛蟲的攻擊而使稚參死亡”一段描述時(shí),則分詞結(jié)果為:稚參,纖毛蟲,幼體解體,纖毛蟲,纖毛蟲,纖毛蟲,協(xié)同致病,細(xì)菌感染,稚參,活力減弱,纖毛蟲,稚參。
3.1.1 TFIDF算法[13]TFIDF是一種用于資訊檢索與資訊探勘的加權(quán)技術(shù),用以評估字詞對于一個(gè)文件集或一個(gè)語料庫中一份文件的重要程度。主要思想是:如果某個(gè)詞或短語在一篇文章中出現(xiàn)的頻率較高,并且在其他文章中很少出現(xiàn),則認(rèn)為此詞或者短語具有很好的類別區(qū)分能力,適合用來分類,則權(quán)重值高。詞頻 (TF)計(jì)算公式為
其中:a為在文檔中詞的出現(xiàn)次數(shù);S為文檔的分詞總數(shù)。逆向文本頻率 (IDF)計(jì)算公式為
其中:N為庫中的文檔總數(shù);n表示出現(xiàn)該分詞的文檔數(shù)目 (加上0.01是為了防止lg返回值為0)。則TFIDF計(jì)算公式為
3.1.2 權(quán)重值的計(jì)算 對上述分詞結(jié)果進(jìn)行遍歷,得出關(guān)鍵詞在用戶輸入中出現(xiàn)的次數(shù),如表2所示。用容器times儲存。將分詞結(jié)果與關(guān)鍵詞庫中的關(guān)鍵詞信息 (儲存在index容器中)進(jìn)行對比,相同時(shí),通過式 (1)、(2)、(3)計(jì)算此時(shí)的權(quán)重。
為了得出總詞數(shù)textSize,引入Java的IKAnalyzer2013.jar對 Q進(jìn)行分詞求出總詞數(shù)。通過Times得到當(dāng)前詞語出現(xiàn)的次數(shù),詞頻Frequency由式 (1)求得。通過函數(shù)docTime(i+1)訪問參數(shù)矩陣庫可讀出當(dāng)前關(guān)鍵詞在病癥庫的多少個(gè)疾病癥狀中出現(xiàn)過,以n表示,通過連接病癥庫可取得總疾病數(shù)目,以N表示,逆向文本頻率可由式(2)求得。最后由式 (3)得出權(quán)重,而未出現(xiàn)的詞條權(quán)重視為0。
權(quán)重值的計(jì)算實(shí)現(xiàn)程序如下:
String temp=index.get(i).toString();
Enumeration<String>e=Times.keys();
while(e.hasMoreElements())
{String key=(String)e.nextElement();
if(key.equals(temp)){
Frequency=(float)Times.get(key)/textSize;公式 (1)
n=docTime(i+1);
inversedocument=(double)(Math.lg((N/n+0.01))/ Math.lg(10));公式 (2)
finalIDF=Frequency*inversedocument;公式 (3)}
else{
finalIDF=0}}
把得出的權(quán)重值以向量的形式儲存到問題向量(b1,b2,b3,b4,…,bi)中,結(jié)果如表 2所示(只顯示上文舉例部分)。
從表2可見:在輸入中出現(xiàn)次數(shù)多且n值較小的詞條權(quán)重較大。反之,詞條在多篇文檔出現(xiàn),則權(quán)值就會較低。
表2 計(jì)算權(quán)重結(jié)果 (部分)Tab.2 Result of weighted value(partial)
3.1.3 余弦相似度模型[14]余弦相似度是計(jì)算相似度的一種模型。首先,將個(gè)體的指標(biāo)數(shù)據(jù)映射到向量空間,然后通過測量兩個(gè)個(gè)體向量間的內(nèi)積空間夾角余弦值來度量它們之間的相似性。兩個(gè)文檔d、q之間的相似度計(jì)算公式為
其中,a、b分別為從兩篇文檔中挑出的詞的詞頻。根據(jù)文檔相似情況,可計(jì)算出0~1的相似度。
3.1.4 疾病相似度的計(jì)算 由于已經(jīng)計(jì)算出問題向量,此時(shí)的問題向量就可以用來標(biāo)識用戶輸入的癥狀文字描述。只需將問題向量和權(quán)重值矩陣中每一條疾病所對應(yīng)的關(guān)鍵詞權(quán)重值所構(gòu)成的向量進(jìn)行相似度比較,就可得出診斷結(jié)果。
表3 診斷結(jié)果Tab.3 Diagnosis of the diseases
通過遍歷權(quán)重值矩陣庫,依次把每篇文檔的權(quán)重值取出,以答案向量(a1,a2,a3,a4,…,ai)表示。答案向量和問題向量通過式 (4)運(yùn)算得到每篇文檔的相似度,結(jié)果如表3所示。經(jīng)驗(yàn)證,算法準(zhǔn)確度較高,如癥狀描述較完善,相似度可達(dá)1.000,若癥狀描述較為模糊,可以采用前文所說的啟發(fā)式常用癥狀描述集合,對癥狀進(jìn)行提前分類,規(guī)范癥狀描述語言,達(dá)到診斷目的。
3.2 查詢模塊及病害瀏覽模塊功能
瀏覽模塊包括疾病圖庫、視頻展示、綜合預(yù)防、常用藥物、疾病防治5個(gè)部分 (圖7)。通過數(shù)據(jù)庫的模糊查詢實(shí)現(xiàn)查詢功能,通過點(diǎn)擊主界面的疾病圖庫可進(jìn)行常見病害的圖譜瀏覽 (圖8)。
圖7 系統(tǒng)界面Fig.7 System interface
圖8 疾病圖庫Fig.8 Disease gallery
3.3 專家在線更新模塊功能的實(shí)現(xiàn)
由于每更新一篇病癥,參數(shù)矩陣和權(quán)重值矩陣都會發(fā)生變化,因此,系統(tǒng)采用清空原有參數(shù)矩陣庫和權(quán)重矩陣庫的方式,面向更新后的病癥庫和關(guān)鍵詞庫,重新生成矩陣內(nèi)容。
對于本系統(tǒng)的參數(shù)矩陣庫和權(quán)重矩陣庫的更新,常規(guī)思路是首先通過訪問更新后的病癥庫和關(guān)建詞庫,得到每篇文章中關(guān)鍵詞的出現(xiàn)次數(shù)和文章總詞數(shù)來重構(gòu)參數(shù)矩陣,然后在重構(gòu)權(quán)重矩陣時(shí),每更新一條權(quán)值都需要訪問參數(shù)矩陣庫、病癥庫、關(guān)鍵詞庫來取得文檔ID對應(yīng)的分詞結(jié)果和文章的總詞數(shù)。其中權(quán)重矩陣庫更新時(shí)間的計(jì)算公式為
其中:S為文檔數(shù)目(N)和關(guān)鍵詞數(shù)目 (indexSize)的乘積;vismatrix、visdisease和visindex分別為訪問參數(shù)矩陣庫、病癥庫、關(guān)鍵詞庫需要的時(shí)間。經(jīng)多次實(shí)驗(yàn),更新一篇文章需要4 min。
為降低兩個(gè)矩陣庫的更新時(shí)間和提升系統(tǒng)實(shí)用性,本系統(tǒng)使用了動態(tài)規(guī)劃的思想,其原理是將問題分成幾個(gè)相應(yīng)的子問題,分階段分別進(jìn)行處理,有些子問題會重復(fù)出現(xiàn),將重復(fù)出現(xiàn)的子問題的計(jì)算和處理結(jié)果儲存起來,在需要時(shí)可直接調(diào)用,雖然儲存會占據(jù)一些內(nèi)存空間,卻可以大幅度提高解決問題的時(shí)間,避免重復(fù)計(jì)算。此思路中重復(fù)出現(xiàn)的子問題就如同公式 (6)中的visdisease和visindex兩個(gè)參數(shù),其會先在重構(gòu)參數(shù)矩陣時(shí)出現(xiàn),而后在重構(gòu)權(quán)重值矩陣庫時(shí)同樣會出現(xiàn),故系統(tǒng)在這兩個(gè)參數(shù)首次出現(xiàn)時(shí)就將其相關(guān)數(shù)據(jù)儲存到內(nèi)存中,需要時(shí)直接從內(nèi)存中調(diào)用,調(diào)用時(shí)間相比于連接數(shù)據(jù)庫可以忽略不計(jì)。用此方法計(jì)算權(quán)重矩陣庫更新時(shí)間的公式如下:
由式 (6)和式 (7)可以看出,式 (7)少了visdisease和visindex兩個(gè)參數(shù)。經(jīng)多次實(shí)驗(yàn)驗(yàn)證,S在系統(tǒng)中實(shí)際為18 166,一共節(jié)省了18 166×2次對數(shù)據(jù)庫的調(diào)用,避免了大量重復(fù)計(jì)算,更新用時(shí)降低到24~26 s。表4為更新牡蠣沿岸單孢子蟲病的結(jié)果。
再用系統(tǒng)對剛剛插入的病害癥狀進(jìn)行診斷,耗時(shí)約為2.7 s,如表5所示。
本系統(tǒng)以分詞算法、TFIDF算法、余弦相似度模型為核心,通過深入研究水產(chǎn)養(yǎng)殖病害相關(guān)知識,并運(yùn)用動態(tài)規(guī)劃的編程思想,設(shè)計(jì)并實(shí)現(xiàn)了具有專家診斷功能、信息瀏覽功能、用戶查詢功能和數(shù)據(jù)庫自動更新功能的水產(chǎn)養(yǎng)殖病害診斷專家系統(tǒng)。
表4 更新結(jié)果 (部分)Tab.4 Update result(partial)
表5 更新后的診斷結(jié)果Tab.5 Result of diagnosis after updating
通過分詞算法可以將用戶輸入的信息進(jìn)行處理,轉(zhuǎn)換為系統(tǒng)可識別的信息;通過TFIDF算法計(jì)算關(guān)鍵詞的權(quán)重,用權(quán)重值構(gòu)成的向量可以將病癥庫中的病癥描述以及用戶輸入的病癥描述進(jìn)行分別的標(biāo)記;通過余弦相似度模型可將權(quán)重值構(gòu)成的向量進(jìn)行相似度的匹配,最后得出診斷結(jié)果;通過開放式的、可由專家在線更新的知識庫,可以讓專家系統(tǒng)獲取源源不斷的知識支持。經(jīng)實(shí)驗(yàn)驗(yàn)證,該系統(tǒng)已達(dá)到設(shè)計(jì)目標(biāo)和使用要求,可用于水產(chǎn)養(yǎng)殖生產(chǎn)中病害的快速診斷與防治。
參考文獻(xiàn):
[1] 于毅,徐睿,劉鑫,等.專家系統(tǒng)在水產(chǎn)養(yǎng)殖病害上的應(yīng)用與發(fā)展[J].北京農(nóng)業(yè),2011(24):42-43.
[2] 于玲.花卉病害診斷專家系統(tǒng)[D].武漢:華中農(nóng)業(yè)大學(xué),2006.
[3] 陳祝爐.水稻病蟲害智能化咨詢與診斷服務(wù)系統(tǒng)的開發(fā)與實(shí)現(xiàn)[D].杭州:浙江大學(xué),2010.
[4] 劉禹.果樹病害數(shù)據(jù)庫的構(gòu)建[D].重慶:西南大學(xué),2012.
[5] 孫敏,羅衛(wèi)紅,馮萬利.等.基于Web的設(shè)施蔬菜作物病害診斷與防治管理專家系統(tǒng)[J].南京農(nóng)業(yè)大學(xué)學(xué)報(bào),2014,37(2):7-14.
[6] 李劍,韓勝菊,常亞青,等.人工智能在海參養(yǎng)殖專家系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2011,31(S1):110-115.
[7] 葉蟬,鄧長輝,曹向南,等.對蝦病害診斷專家系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].大連海洋大學(xué)學(xué)報(bào),2015,30(3):319-323.
[8] 鐘昌樂,鐘勇,馬春全,等.基于Spring框架的畜禽疾病診斷專家系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(4):87-89.
[9] 肖輝輝,鄭涵,羅日才,等.基于B/S架構(gòu)的稿件管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].軟件導(dǎo)論,2015,14(4):96-98.
[10] 劉雙印,徐龍琴,沈玉利.基于.NET的對蝦病害防治專家系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(13):3444-3447.
[11] 徐寶祥,葉培華.知識表示的方法研究[J].情報(bào)科學(xué),2007,25(5):690-694.
[12] 蔡勇智.基于最大匹配分詞算法的中文詞語粗分模型[J].福建電腦,2005(9):39-40.
[13] 張建娥.基于TFIDF和詞語關(guān)聯(lián)度的中文關(guān)鍵詞提取方法[J].情報(bào)科學(xué),2012,30(10):1542-1544,1555.
[14] 陳大力,沈巖濤,謝檳竹,等.基于余弦相似度模型的最佳教練遴選算法[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2014,35(12):1697-1700.
An expert system of disease treatment in aquaculture based on WEB
YAN Xiao-tong1,XU Xiang1,GUO Xian-jiu1,2,SUN Kai-le1
(1.College of Information Engineering,Dalian Ocean University,Dalian 116023,China;2.Key Laboratory of Ocean Information Technology of Liaoning Province,Dalian 116023,China)
Abstract:An expert system of disease treatment in aquaculture is designed and implemented based on WEB by TFIDF weighted algorithm,design idea of dynamic programming aswell as cosine similaritymodel.The system including expert diagnosismodule,querymodule,browse and experts online updatemodule can automatically extract the keywords of user input symptoms by weighting TFIDF algorithm,and then conclude the input textwith each of the document similarity in the knowledge base using cosine similaritymodel formula,and finally give the high similarity of the first three diseases and their treatment as a diagnostic feedback to the user.The experimental results showed that the system quicklymade correct diagnosis for the disease symptom of user input.
Key words:aquaculture;disease diagnosis;expert system;repository
中圖分類號:TP311
文獻(xiàn)標(biāo)志碼:A
DOI:10.16535/j.cnki.dlhyxb.2016.02.019
文章編號:2095-1388(2016)02-0225-06
收稿日期:2015-06-08
基金項(xiàng)目:國家海洋公益性行業(yè)科研專項(xiàng) (201205023-4);遼寧省科技計(jì)劃項(xiàng)目 (2012216012)
作者簡介:閻笑彤 (1991—),男,碩士研究生。E-mail:moon1313@163.com
通信作者:郭顯久 (1963—),男,博士,教授。E-mail:gxj@dlou.edu.cn