亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于相似度算法的英語智能問答系統(tǒng)設計與實現(xiàn)

        2017-07-10 10:27:26王文輝吳敏華駱力明
        計算機應用與軟件 2017年6期
        關鍵詞:語義單詞用戶

        王文輝 吳敏華 駱力明 劉 杰

        (首都師范大學信息工程學院 北京 100048)

        基于相似度算法的英語智能問答系統(tǒng)設計與實現(xiàn)

        王文輝 吳敏華 駱力明 劉 杰

        (首都師范大學信息工程學院 北京 100048)

        智能問答系統(tǒng)是在搜索引擎的基礎上融合了自然語言知識和應用的人工智能產品,相比較傳統(tǒng)的依靠關鍵字匹配的搜索引擎,能夠更好地滿足用戶的查詢需求。針對現(xiàn)有的英語智能問答系統(tǒng)中知識呈現(xiàn)的單一化以及系統(tǒng)查詢效率低等現(xiàn)狀,采用基于距離的相似度算法,設計并實現(xiàn)了基于相似度算法的英語智能問答系統(tǒng)。實驗結果表明該系統(tǒng)能夠較為準確地回答小學生的英語問題,對遠程教育中小學英語智能問答系統(tǒng)的構建起到參考和借鑒的作用。

        智能問答系統(tǒng) 搜索引擎 關鍵字匹配 相似度算法

        0 引 言

        隨著21世紀進入人們的視野,網絡通信技術飛速發(fā)展,大數(shù)據(jù)時代逐漸進入人們視野,紛繁復雜的數(shù)據(jù)信息充斥著互聯(lián)網,互聯(lián)網承載的信息量在不斷增長。這些龐大的信息逐漸成為了回答用戶提問的重要來源。傳統(tǒng)的搜索引擎信息檢索方式大部分還是按照關鍵詞進行搜索。這種檢索方式雖然能方便用戶查詢信息,但它在一定程度上反饋給用戶的是大量相關和無關的搜索結果,用戶很難從中快速地找到自己想要的答案。如何從海量的信息源中準確獲取到用戶最需要的信息,是信息化時代研究者們共同追求的目標。

        近年來,問答系統(tǒng)的出現(xiàn)逐漸引起了學者們的關注。智能問答系統(tǒng)是自然語言處理和信息檢索領域的一個新的研究熱點,它允許用戶以自然語言形式的句子提問,并采用自然語言處理技術自動地將簡潔、準確的答案返回給用戶[1-2],它的出現(xiàn)體現(xiàn)了人們對快速、準確檢索信息的探索與追求。與傳統(tǒng)搜索引擎相比,智能問答系統(tǒng)不僅符合用戶提問的表達形式,而且相對于搜索引擎的關鍵詞匹配方式,在對問句理解的提問意圖方面具有明顯優(yōu)勢,并且能夠直接把用戶想要的答案提煉好并以結構化的方式呈現(xiàn)給用戶。這種智能化的問答方式在遠程教育答疑解惑中發(fā)揮著重要的作用。

        知識本體庫是用戶提問的“問題-答案”庫,這些問題所對應的答案都存儲在數(shù)據(jù)庫中。當用戶提出一個問題時,該問答系統(tǒng)通常先對常規(guī)問題集FAQ(Frequently Asked Question)進行檢索,然后搜尋出最相似的問題答案,返還給用戶。如果該系統(tǒng)在FAQ庫中找不到用戶滿意的答案,系統(tǒng)將自動切換到知識本體庫中進行檢索。其中,相似度算法是智能問答系統(tǒng)中的關鍵技術,用來實現(xiàn)知識本體庫中最相似問句的查找。通過對用戶提出的問題與知識本體庫中存儲的問題答案進行相似度計算,然后選取相似度最高的答案作為用戶提出的問題答案,并將對應的答案信息返還給用戶。

        目前,句子相似度算法在現(xiàn)實中有著廣泛的應用,它的研究狀況影響著其他相關領域的研究進展,句子相似度算法在問答系統(tǒng)的各個領域都有著非常重要的作用,如在中文FAQ問答系統(tǒng)中[3],在本體問答系統(tǒng)中[4],在OTC問答系統(tǒng)中的使用[5]以及在基于常見問題集的機器問答系統(tǒng)中的使用等[6],句子相似度算法都是問答系統(tǒng)中的關鍵技術之一?;诖?,本文將句子相似度算法應用于小學英語智能問答系統(tǒng)中,設計并實現(xiàn)了英語智能問答系統(tǒng)。句子相似度算法綜合考慮了英語問句單詞和語義多方面的特征,不僅提高了英語智能問答系統(tǒng)的運行效率,而且準確地回答了小學生的英語問題。該系統(tǒng)還能滿足小學生英語智能問答學習的功能需求,更好地幫助小學生實現(xiàn)多樣化英語學習。

        1 系統(tǒng)的設計

        1.1 系統(tǒng)模型

        英語智能問答系統(tǒng)是自然領域的一種較高級的信息檢索技術,它的目的是希望小學生通過使用該系統(tǒng)能夠對日常生活中基本的英語句子進行提問,然后得到一個準確的答案。簡單來說,英語智能問答系統(tǒng)就是通過分析學生提出的英語問題并理解問題含義,然后將答案返回給學生。

        如圖1所示,英語智能問答系統(tǒng)的組成有四個模塊:第一個是問題分析模塊,該模塊的內容主要包括五個部分:單詞還原、詞性標注、問句類型分析、問句答案類型分析以及關鍵詞提取。第二個模塊是相似度計算,相似度計算模塊是問答系統(tǒng)的核心內容,這部分主要是詞語相似度計算和語句相似度計算。第三個模塊是答案抽取,這部分主要是進行相似度排序、篩選答案以及輸出答案。最后一個模塊是知識推送,這部分內容主要是通過了解不同用戶的知識水平等級、相關知識難度以及用戶對資源類型的偏好,將答案以多樣化的形式呈現(xiàn)給用戶。

        圖1 英語智能問答系統(tǒng)模型

        1.2 問題分析模塊

        問題分析模塊是智能問答系統(tǒng)中不可缺少的一部分,它的目標是使計算機能夠理解用戶的查詢語義,為后續(xù)進行的答案抽取模塊工作做準備。準確的問題分析有助于系統(tǒng)在答案抽取模塊時針對不同類別的問題使用相應的答案抽取方法和策略。當用戶輸入一個英語問句時,問題分析模塊將對其進行分析和處理,處理程序包括:

        (1) 單詞還原

        把問句與答案句中所有的單詞變回原型。例如:助動詞had、has變?yōu)閔ave,復數(shù)單詞sports變?yōu)閟port,be動詞變?yōu)閕s、was變?yōu)閎e。

        (2) 詞性標注

        對還原后的每個單詞進行詞性標注。其中包括詞性為動詞的單詞、詞性為名詞的單詞詞性為形容詞的單詞和詞性為副詞的單詞。

        (3) 問句類型分析

        對用戶提出的一些常用英語問句類型進行分析,如以“What kind of……”、“How do you like……?”、“Which is……?”等為代表的英語問句。

        (4) 問句答案類型分析

        判斷用戶提出的問句是屬于哪一類型的事物。問句答案類型主要有回答、情境對話等多種。每個類型又包含四種媒體呈現(xiàn)方式:音頻、視頻、繪本、圖片。分為難、中、易三個等級。

        此外,用戶還可以單獨輸入一個單詞查詢所得結果。單詞答案類型包括回答、課文原句、情景段落、延伸例句等。對單詞以及問句答案類型進行劃分與確定,不僅豐富了英語知識呈現(xiàn)的形式,而且在一定程度上提高了小學生學習英語的積極性和學習興趣。問句和單詞答案具體分類如表1所示。

        表1 問句和單詞答案類型

        (5) 關鍵詞提取

        英語問句中包含的關鍵詞代表了該句子的主要含義。在檢索過程中,關鍵詞按照詞性的不同被賦予不同的權重,權重從大到小依次為名詞、限定性副詞、形容詞和動詞[7]。

        1.3 相似度計算模塊

        句子相似度計算方法主要通過計算兩條語句之間的相似度來選取合適的句子。其中語句的相似度主要包含詞形、句法、語義等方面,計算結果得出的相似度值越大,表明兩個句子在詞形、句法、語義等方面的信息越接近[8]。本研究在計算英語問句相似度時采用的是基于距離的相似度算法,該算法基于 WordNet 概念語義分類詞典,計算英語單詞間相似度采用概念詞相似度計算方法,得到英語單詞之間相似度后根據(jù)夾角余弦相似度的計算方法得出英語語句間的語義相似度。

        1.4 答案抽取模塊

        答案抽取模塊是對信息檢索模塊得到的備選答案問句進行詞法、句法和語義等方面的分析,需要對答案進行排序。另外系統(tǒng)也需要設置一個閾值,只有語句相似度大于設定的閾值,才輸出檢索的結果,通過強制性關鍵詞表對檢索的結果進行過濾,去掉和檢索結果無關的內容,然后根據(jù)查詢問句所屬類別提煉答案,以符合用戶知識水平的方式返回給用戶最合適的問題答案[9]。該模塊主要通過問句相似度計算從知識本體庫中得到最相似的備選答案,之后進行答案抽取,將相似度值大于0.8的備選答案依照相似度值的大小進行排序,并且根據(jù)問題分析模塊獲取的問題類型,將備選答案推送給知識推送模塊。

        1.5 知識推送模塊

        知識推送模塊是該系統(tǒng)的重要組成部分,與眾不同之處在于它考慮到了用戶個人的興趣愛好,每個用戶都有自己獨特的學習方式,該模塊能夠根據(jù)用戶的瀏覽信息推送不同的知識。智能問答系統(tǒng)根據(jù)用戶的先前知識水平、興趣愛好以及學習方式等特征提供多種多樣的答案給用戶,不同的用戶會得到符合自己知識水平的問題答案。在知識推送模塊中,將問題答案呈現(xiàn)內容根據(jù)難易程度劃分為三個級別,簡單、中等、困難。通過不同用戶的知識水平背景推薦不同難度等級的問題答案(如表2所示)。

        表2 問題答案難度等級

        1.6 知識本體庫

        如圖2所示,本系統(tǒng)的知識本體庫分為三部分:知識本體、教材組織本體和資源庫。知識本體包括單詞本體和句子本體,具有不同的屬性;每個屬性由圖片、音頻、視頻、繪本等資源組成,以滿足不同學習者的個性化需求。由于相似度計算模塊的算法是在相同的疑問詞中查找相似度最高的句子,這就會遺漏不同疑問詞中語義相似度高的句子,所以建立一個特例句子本體庫,鏈接此類句子,以提高查找精度。單詞教材組織本體和句子教材組織本體都繼承教材組織本體,包含教材特征的所有屬性。

        圖2 知識本體結構圖

        2 系統(tǒng)關鍵技術

        2.1 相似度算法

        基于距離的相似度計算是目前使用較多的算法之一,它的基本思想是通過獲得語義詞典樹當中兩個概念詞之間的路徑長度來衡量它們的語義距離,語義相似度和語義距離之間呈現(xiàn)負相關的關系。如果兩個詞語之間的語義距離越大,那么相似度就越低;反之,如果兩個詞語之間的語義距離越小,那么相似度就越高[10]。

        2.1.1 語間概念詞相似度

        本文參考了Li[11]提出的概念相似度算法的思想,該算法非常經典且具有代表性,并引用改進的概念詞相似度計算方法[12],算法定義如下:

        (1)

        其中,L表示兩個概念詞W1與W2之間的最短路徑長度,Hc表示W1和W2公共上位詞集的深度,Hw1表示概念詞W1的深度,Hw2表示概念詞W2的深度。α為常數(shù)(根據(jù)Li的實驗取值為0.2)。

        式(1)需要滿足如下幾個約束條件:

        (1) 如果兩個概念詞之間的最短路徑越短,那么它們的語義相似度就越大;

        (2) 如果兩個概念詞的公共上位詞的深度越大,那么它們的語義相似度就越大;

        (3) 如果兩個概念詞分別到公共上位詞的距離越短,那么它們的語義相似度就越大;

        (4) 兩個概念詞之間的語義相似度值位于區(qū)間[0,1]之內。

        2.1.2 語句間語義相似度

        本文在衡量語句間相似度時,使用向量空間模型來表示英文語句,向量空間模型是一種較好的文本表示方法之一。向量空間模型VSM(vector space model)的基本思想是把文本中的單詞、短語等包含語義的最小單位分割開,然后將其對應的相似度值作為向量中的元素[13-14]。這種向量空間模型的表述方式能夠準確而客觀的表達英語文本的語義信息。在對兩條英語問句和答案句進行向量化表示以后,使用向量相似度測量方法——夾角余弦來獲得英語語句間的語義相似度。

        1) 語句的向量化表示

        在對英文語句進行向量化表示時,需要把兩條英文語句表示成等長度的向量。例如兩條英文語句T1和T2,將兩條語句中的所有單詞匯集在一起,構成一個聯(lián)合詞集T:

        T=T1∪T2={w1,q1,…,wm,qn}

        (2)

        聯(lián)合詞集T包含了英文語句T1和T2中所有的單詞,將T1和T2中相同的單詞都去掉,保證聯(lián)合詞集T中所有元素的互異性。其中集合{w1,w2,…,wm}表示英文語句T1中的所有單詞集合,集合{q1,q2,…,qn}表示英文語句T2中的所有單詞集合。下面以兩條英文例句來具體說明:

        T1:{What is your favorite sports?}

        T2:{What kind of sports do you enjoy most?}

        T1和T2組成聯(lián)合詞集T:{ What be your favorite sport kind of do you enjoy most ?}

        其中,聯(lián)合詞集T是由兩條英文語句中的單詞原形并去掉冠詞、感嘆詞等不具有真正語義信息的單詞組成的,并且兩個語句中相同的單詞只記錄一次。將聯(lián)合詞集T用一個向量來表示,稱這個向量為聯(lián)合語義向量,記作S。同時將兩條英文語句T1和T2分別都使用聯(lián)合語義向量S1和S2表示。聯(lián)合語義向量的長度與聯(lián)合詞集中單詞的個數(shù)相等。向量中每個單詞分量的值根據(jù)以下方法確定:

        (1) 當Wi包含在語句中,Si取值為1;

        (2) 當Wi不包含在語句中,那么使用式(1)計算單詞間相似度。

        由上述方法得到英文語句T1和T2分別對應的聯(lián)合語義向量S1和S2:

        S1:{1,1,1,1,1,0.8,0,0,1,0.8,0.9};

        S2:{1,0,1,0.8,1,1,1,1,1,1,1 }。

        其中,S1中的各個數(shù)值依次為What與What、 be與be、 your與your、favorite與favorite、 sport與sport 、kind與favorite、you與your、 enjoy與favorite、most與favorite之間的綜合相似度(其中of是介詞無比較單詞,do與是助動詞無比較單詞);S2中的各個數(shù)值依次為What與What、 your與you、favorite與enjoy、 sport與sport 、kind與kind、you與you、 enjoy與enjoy、 most與most之間的綜合相似度(其中of是介詞無比較單詞,do與是助動詞無比較單詞,be是系動詞無比較單詞)。

        2) 語句間的相似度計算

        確定了兩條英文語句T1與T2的聯(lián)合語義向量S1和S2之后,根據(jù)式(3)計算得到T1與T2語句間的相似度。最后,將語句間相似度大于預設閾值的備選答案作為最終答案。

        (3)

        2.2 相似度算法流程

        該算法輸入為用戶提問的一條英語問句,輸出結果為與該問句相似的所有備選答案以及相似度值,相似度取值的區(qū)間為[0,1]。以下為本算法在執(zhí)行英語問句時的具體處理流程(如圖3所示)。

        Step1 用戶輸入一個英語問句,進行問句預處理操作,然后在知識本體庫中檢索得到備選答案;

        Step2 將問句和備選答案句中的單詞進行還原處理;

        Step3 對還原后的每個單詞進行詞性標注;

        Step4 將處理后的問句和答案句中的不同單詞組成聯(lián)合詞集;

        Step5 將聯(lián)合詞集向量化表示,構成聯(lián)合語義向量集;

        Step6 根據(jù)式(1)計算得出的概念詞相似度給聯(lián)合語義向量集中的每一個分量賦值;

        Step7 根據(jù)式(3)計算問句和答案句分別對應的聯(lián)合語義向量的余弦相似度得出語義相似度;

        Step8 將計算出的step7中的語義相似度結果進行排序,最終選取相似度最高的句子作為問題答案。

        圖3 算法執(zhí)行流程圖

        3 系統(tǒng)的實現(xiàn)

        該系統(tǒng)以MYSQL數(shù)據(jù)庫和知識本體庫作為后臺數(shù)據(jù)庫管理系統(tǒng)。使用到的數(shù)據(jù)表有問題表、問題答案表、答案表、學習偏好表、常用詞詞典以及WordNet作為語義詞典。在Eclipse平臺下采用(Spring MVC+ Maven+Mybatis)等架構。系統(tǒng)實現(xiàn)的具體流程如圖4所示。

        圖4 智能問答系統(tǒng)執(zhí)行流程圖

        如圖4所示,用戶輸入問句進行提問,之后系統(tǒng)首先查詢FAQ問題集,如果查找到了問題答案,便進行篩選,將最合適的答案返回給用戶。如果在FAQ庫中沒有找到問題答案,便查詢知識本體庫。這一階段需要經過一系列句法處理,如單詞還原、詞性標注等過程形成關鍵詞集,然后將處理好的英文語句進行相似度計算,最后返回相似度最高的問題答案給用戶,根據(jù)用戶知識水平呈現(xiàn)多樣化答案內容。問句答案可以在知識本體庫中查詢到對應的ID值,獲取到與該ID值相關的若干屬性值。用戶本體庫存儲著每個學生的知識水平等級、學習風格等信息,最后通過知識推送模塊推薦給學習者合適的學習內容。

        3.1 數(shù)據(jù)測試結果

        如表3所示,實驗結果采用正確率和綜合相似度進行評估,本實驗總共輸入432條句子、910個單詞,正確率分別為82.17%和91.09%,綜合相似度值均大于0.8。從測試結果可以看出該算法能夠提高實驗結果的正確率,并且句子綜合相似度較高,提高了系統(tǒng)效率。

        表3 系統(tǒng)數(shù)據(jù)測試結果

        3.2 單詞查詢結果

        當用戶在搜索框輸入一個英語單詞時,系統(tǒng)會呈現(xiàn)與該單詞相關的多種類型的答案,例如對應單詞的課文原句、情景段落、延伸例句等。在查詢單詞的過程中,系統(tǒng)首先查詢FAQ庫,如果查到答案便直接呈現(xiàn)給用戶;如果FAQ庫沒有答案,便查詢知識本體庫將答案呈現(xiàn)給用戶。

        例如,以輸入單詞“river”為例進行查詢。如圖5所示,用戶輸入單詞“river”,系統(tǒng)呈現(xiàn)與該單詞相關的結果。其中包含:課文原句“I see some ships and boats on the river”;情境段落“That’s the Thames.It’s a long and wide river”;延伸例句“Jimmy can swim across the river”;百科“中國的第一大河-長江長約6 300公里。”;用法“單詞、句型”;聯(lián)想“wide(寬的)/water(水)/long(長的)”;同義詞“water”;反義詞“desert”;拓展“river bed(河床)/river side(河岸)”;常用“cross the river(渡河)/mouth of the river(河口)”。

        圖5 單詞查詢結果

        3.3 問句查詢結果

        當用戶在搜索框輸入一個問句時,系統(tǒng)會呈現(xiàn)與該問句相關的多種類型的答案,例如回答、情境對話、重要句型、課后單詞等。在查詢問句的過程中,系統(tǒng)首先查詢FAQ庫,如果查到答案便直接呈現(xiàn)給用戶;如果FAQ庫沒有答案,便查詢知識本體庫將答案呈現(xiàn)給用戶,在查詢本體庫的同時,對查到的相關語句答案進行相似度計算,選取相似度最大的問題答案作為最終答案返回給用戶。

        例如,以輸入問句“Excuse me, What is her name?”進行查詢。如圖6所示,對用戶所提問句預處理之后,在知識本體庫一共查詢到26條與問句相關的答案。ID是每條備選答案的唯一標識,與問句“Excuse me, What is her name?”最相似的句子ID為1/10/7/3的語句“What is your name”,相似度值為0.52。

        圖6 相似度算法查詢問句結果

        圖7為問句查詢結果,其中包含:問題“What’s your name?”,回答“His name is Mocky”。情景對話“A:Is this yours? B:Yes,it’s mine.A:Are there any gift in your bag? B:Well,open it and see.C:Dad,this bag isn’t yours.There are woman’s clothes.D:Maybe it’s hers.A:This bag isn’t his.Is it yours? E:Yes,it’s mine.What’s your name? B: His name is Mocky.”;本課重要句型:無;本課課后單詞:“1. hers 她的(所有物)2.his 他的(所有物)3.yours 你(們)的(所有物)”。

        圖7 問句查詢結果

        3.4 系統(tǒng)運行效果分析

        本系統(tǒng)收集與整理了眾多小學生在使用問答系統(tǒng)過程中常見問題和普遍性問題2 000多個,問題答案使用批量導入方式,通過教材收集問題答案然后存入知識本體庫中。系統(tǒng)運行三個月以來,接受各學校小學生使用累計3 058次,并對此進行了統(tǒng)計分析如表4所示,其中λ(0≤λ≤1)為系統(tǒng)設定的相似度閾值,在這里λ分別取0.7/0/8/0.9三個數(shù)值來衡量句子相似度。

        表4 句子相似度結果所占比例

        由表4可以看出:(1)對于λ取不同的值時,出現(xiàn)相似問句的數(shù)量并不相同,其中當λ=0.8時相似句子出現(xiàn)數(shù)量最高,占總體比例的70.4%,說明本系統(tǒng)在采用基于距離的相似度算法有較高的準確性。(2)當λ=0.9時相似單詞出現(xiàn)數(shù)量最高,達到了90%以上。由此可見,無論是在查詢單詞還是句子方面,系統(tǒng)已經較好地滿足了實際應用的需求。

        4 結 語

        小學英語問答系統(tǒng)能否實現(xiàn)智能化,最直接的體現(xiàn)就是能否準確地回答用戶提出的問題。本文通過研究英語句子相似度算法,介紹了英語智能問答系統(tǒng)的模型以及模型每個模塊的功能和作用,并給出了具體的系統(tǒng)設計和開發(fā)過程,并在此基礎上編碼實現(xiàn)了基于相似度算法的小學英語智能問答系統(tǒng)。經過實際體驗與使用,該系統(tǒng)不僅可以智能、準確地回答用戶提出的問題,還可以提供一些與用戶所提問題相關的知識答案,而且該系統(tǒng)查找速度快,基于距離的相似度算法提高了英語智能問答系統(tǒng)的查準效率。后續(xù)研究將對相似度算法進行改進,以便更加準確、快速地查詢用戶所需要的內容,進一步提高系統(tǒng)的效率。同時在系統(tǒng)實際使用的過程中,將繼續(xù)搜集用戶點擊頁面資源次數(shù)、瀏覽時間等內容獲取用戶的偏好信息,自適應推薦給用戶學習資源,實現(xiàn)個性化學習。

        [1] 張江濤, 杜永萍. 基于語義鏈的檢索在 QA 系統(tǒng)中的應用[J]. 計算機科學, 2013, 40(2): 257-260.

        [2] 錢強, 龐林斌, 高尚. 一種基于詞共現(xiàn)圖的受限領域自動問答系統(tǒng)[J]. 計算機應用研究, 2013, 30(3): 841-843.

        [3] 葉正, 林鴻飛, 楊志豪. 基于問句相似度的中文 FAQ 問答系統(tǒng)[J]. 計算機工程與應用, 2007, 43(9): 161-163.

        [4] 劉漢興, 劉財興, 林旭東. 基于問句相似度的本體問答系統(tǒng)[J]. 廣西師范大學學報自然科學版, 2010, 28(1):88-91.

        [5] 樊康新. 基于常見問題集的 OTC 問答系統(tǒng)的設計與實現(xiàn)[J]. 計算機系統(tǒng)應用, 2008 (12): 30-34.

        [6] 劉曉義, 王培東, 周洪玉. 基于知識處理重型切削數(shù)據(jù)庫的設計與實現(xiàn)[J]. 哈爾濱理工大學學報, 2004,9(1):11-13.

        [7] 馬莉. 基于動態(tài)本體知識庫的問答系統(tǒng)的研究與實現(xiàn)[D]. 廣西師范大學, 2009.

        [8] 周法國, 楊炳儒. 句子相似度計算新方法及在問答系統(tǒng)中的應用[J]. 計算機工程與應用, 2008, 44(1): 165-167.

        [9] 劉里, 曾慶田. 自動問答系統(tǒng)研究綜述[J]. 山東科技大學學報(自然科學版), 2007, 26(4): 73-76.

        [10] 王赫寧. 基于 WordNet 的英文語句相似度算法的研究[D]. 東北師范大學, 2014.

        [11] Li Y, McLean D, Bandar Z A, et al. Sentence similarity based on semantic nets and corpus statistics[J]. Knowledge and Data Engineering, IEEE Transactions on, 2006, 18(8): 1138-1150.

        [12] 王赫寧. 基于 WordNet 的英文語句相似度算法的研究[D]. 東北師范大學, 2014.

        [13] Lee D L, Chuang H, Seamons K. Document ranking and the vector-space model[J]. Software, IEEE, 1997, 14(2): 67-75.

        [14] 張劍, 李春平. 基于 WordNet 概念向量空間模型的文本分類[J]. 計算機工程與應用, 2006, 42(4): 174-178.

        DESIGN AND IMPLEMENTATION OF ENGLISH INTELLIGENT QUESTION-ANSWERING SYSTEM BASED ON SIMILIARITY ALGORITHM

        Wang Wenhui Wu Minhua Luo Liming Liu Jie

        (CollegeofInformationEngineering,CapitalNormalUniversity,Beijing100048,China)

        Compared with the traditional search engine which is rely on the keyword matching, intelligent question-answering system integrates with the knowledge and application of natural language on the basis of the search engine, so as to satisfy users’ information retrieval requirement. Aiming at current simplified knowledge and inefficient system query of English intelligent question answering system, the research adopts the similarity algorithm based on distance , designing and implementing English intelligent question answering system based on similarity algorithm. The results show that the system can answer students’ questions accurately. The conclusion of this research can be used as references to the construction of English intelligent question answering system in distance education.

        Intelligent question-answering system Search engine Keyword matching Similarity algorithm

        2016-08-09。國家社會科學基金重大委托項目(14&ZH0036);北京市教育科學十二五規(guī)劃重點課題(AJA12132)。王文輝,碩士生,主研領域:自然語言處理和語義網。吳敏華,教授。駱力明,教授。劉杰,副教授。

        TP311

        A

        10.3969/j.issn.1000-386x.2017.06.013

        猜你喜歡
        語義單詞用戶
        語言與語義
        單詞連一連
        看圖填單詞
        看完這些單詞的翻譯,整個人都不好了
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        “上”與“下”語義的不對稱性及其認知闡釋
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        認知范疇模糊與語義模糊
        如何獲取一億海外用戶
        午夜视频在线观看一区二区小| 亚洲成精品动漫久久精久| 性感人妻中文字幕在线| 亚洲一区亚洲二区视频在线| 又粗又大又硬毛片免费看| 无码中文字幕人妻在线一区二区三区| 久久这里都是精品一区| 美女性色av一区二区三区| 国产精品亚洲精品日韩已方| 无码av免费一区二区三区| 91福利国产在线观一区二区 | 久久精品国产精品亚洲| 少妇spa推油被扣高潮| 欧美在线观看www| 91久久国产香蕉熟女线看| 欧美成人猛交69| 牛牛本精品99久久精品88m| 国产亚洲青春草在线视频| 24小时免费在线观看av| 狠狠综合久久av一区二区| 亚洲中文字幕无线无码毛片 | 日本护士xxxx视频| 国产精品一区二区久久精品| 婷婷精品国产亚洲av| 国产av一区二区三区在线播放| 国产成人亚洲精品| 亚洲色欲久久久综合网| 在线久草视频免费播放| av无码一区二区三区| 亚洲一区二区三区国产精华液| 白白色发布永久免费观看视频| 激情在线一区二区三区视频| 国产精品51麻豆cm传媒| 欧美久久久久中文字幕| 自拍情爱视频在线观看| 欧美牲交a欧美牲交aⅴ| 国语对白做受xxxxx在线中国| 日韩av一区二区三区精品| 青青草狠吊色在线视频| 男受被做哭激烈娇喘gv视频| 99国产综合精品-久久久久|