亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自然語(yǔ)言問答系統(tǒng)研究進(jìn)展分析*
        ——以中國(guó)知網(wǎng)2000-2020年收錄論文為樣本

        2022-03-03 02:12:26輝,王琲,劉
        圖書館研究 2022年1期
        關(guān)鍵詞:詞頻知識(shí)庫(kù)領(lǐng)域

        郭 輝,王 琲,劉 飛

        (1.新疆醫(yī)科大學(xué)第五附屬醫(yī)院,新疆 烏魯木齊 830011;2.新疆維吾爾自治區(qū)人民醫(yī)院,新疆 烏魯木齊 830001;3.新疆醫(yī)科大學(xué)圖書館,新疆 烏魯木齊 830017)

        1 引言

        自然語(yǔ)言問答系統(tǒng)是一種使用自然語(yǔ)言提問和回答的搜索引擎,其特點(diǎn)是可以利用對(duì)問題的語(yǔ)義分析提供給用戶精確簡(jiǎn)潔的問題答案。自然語(yǔ)言問答系統(tǒng)是通過人機(jī)對(duì)話,采用自然語(yǔ)言問答的方式獲取信息的系統(tǒng),可用于知識(shí)工程、信息檢索、專家系統(tǒng)等領(lǐng)域[1]2-4。本文對(duì)我國(guó)自然語(yǔ)言問答系統(tǒng)的文獻(xiàn)進(jìn)行調(diào)研與分析,文獻(xiàn)調(diào)研的數(shù)據(jù)來源為中國(guó)知網(wǎng)(CNKI),選取的文獻(xiàn)時(shí)間范圍設(shè)定在2000年至2020年,采用文獻(xiàn)計(jì)量的方法得出文獻(xiàn)計(jì)量分析結(jié)果,包括學(xué)科領(lǐng)域分布、文獻(xiàn)的年度分布、機(jī)構(gòu)分布、高頻關(guān)鍵詞及基于關(guān)鍵詞共現(xiàn)的熱點(diǎn)主題,以便了解和掌握我國(guó)自然語(yǔ)言問答系統(tǒng)領(lǐng)域的研究現(xiàn)狀,為未來的研究提供一定的理論參考。

        2 數(shù)據(jù)來源及統(tǒng)計(jì)分析

        2.1 數(shù)據(jù)來源

        利用CNKI 數(shù)據(jù)庫(kù)檢索自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)。首先將“問答系統(tǒng)”選為主題詞,考慮到“問答技術(shù)”“知識(shí)問答”“智能問答”也是自然語(yǔ)言處理的一個(gè)方向,因此再將“問答技術(shù)”“知識(shí)問答”“智能問答”也選為主題詞。最終構(gòu)建出如下檢索式:

        主題=(“問答系統(tǒng)”O(jiān)R“問答技術(shù)”O(jiān)R“知識(shí)問答”O(jiān)R“智能問答”)。

        利用上述檢索式在CNKI數(shù)據(jù)庫(kù)中進(jìn)行檢索,檢索時(shí)間為2000 年1 月至2020 年12 月。去除與自然語(yǔ)言問答系統(tǒng)無關(guān)的文獻(xiàn),共得到8 353篇相關(guān)文獻(xiàn)。這些文獻(xiàn)的來源有學(xué)術(shù)期刊、博士學(xué)位論文、碩士學(xué)位論文、會(huì)議論文、報(bào)紙全文等多種形式。其中:期刊論文(4 751篇,占56.87%)、學(xué)位論文(937篇,占11.65%)。

        2.2 學(xué)科分布

        從學(xué)科分布來看,如表1所示,輕工業(yè)、醫(yī)學(xué)、行政、自動(dòng)化、數(shù)字圖書館、電力、園藝和建筑等是自然語(yǔ)言問答系統(tǒng)研究的主要領(lǐng)域。其中計(jì)算機(jī)軟件學(xué)科的研究文獻(xiàn)最多,通過分析文獻(xiàn)內(nèi)容可知,該領(lǐng)域主要關(guān)注于自然語(yǔ)言問答系統(tǒng)的開發(fā)和改進(jìn)研究。

        表1 自然語(yǔ)言問答系統(tǒng)發(fā)文量學(xué)科分布

        2.3 文獻(xiàn)的年度分布

        文獻(xiàn)發(fā)表的年度分布情況如圖1 所示,從2000 年開始,自然語(yǔ)言問答系統(tǒng)研究的文獻(xiàn)數(shù)量處于波動(dòng)上升的趨勢(shì),2008年至2013年發(fā)文量減少,2013 年至2020 年又持續(xù)上升??傮w來看,近20年自然語(yǔ)言問答系統(tǒng)的研究文獻(xiàn)數(shù)量呈上升趨勢(shì),其年度分布也較為均衡。

        圖1 近20年自然語(yǔ)言問答系統(tǒng)發(fā)文量

        2.4 文獻(xiàn)的機(jī)構(gòu)分布

        自然語(yǔ)言問答系統(tǒng)的研究機(jī)構(gòu)共有34 個(gè)。其中,發(fā)文量15 篇及以上的機(jī)構(gòu)如表2 所示。發(fā)文量排名前三位機(jī)構(gòu)分別是:哈爾濱工業(yè)大學(xué)(165篇)、北京郵電大學(xué)(96篇)、電子科技大學(xué)(57篇)。說明這三所機(jī)構(gòu)在整個(gè)自然語(yǔ)言問答系統(tǒng)研究領(lǐng)域中占據(jù)重要地位。

        表2 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)機(jī)構(gòu)分布

        3 自然語(yǔ)言問答系統(tǒng)的研究主題分析

        3.1 關(guān)鍵詞整合

        關(guān)鍵詞是由作者主觀賦予文獻(xiàn)的詞組,以反映文獻(xiàn)的核心內(nèi)容,是文獻(xiàn)的核心所在。因不同的文獻(xiàn)作者對(duì)于關(guān)鍵詞的使用不統(tǒng)一,在對(duì)關(guān)鍵詞進(jìn)行分析之前,有必要對(duì)關(guān)鍵詞進(jìn)行如下規(guī)范化處理。

        (1)同義詞合并:將表示同義的詞匯合并為一個(gè)規(guī)范的詞匯。如將“關(guān)鍵詞提取”和“關(guān)鍵詞抽取”合并為“關(guān)鍵詞提取”。

        (2)上下位類合并:將下位類合并到上位類,將一些比較零散的特指概念合并到上位類,如將“姓名識(shí)別”和“命名實(shí)體識(shí)別”統(tǒng)一合并為“命名實(shí)體識(shí)別”。

        (3)基本概念剔除:鑒于自然語(yǔ)言、問答系統(tǒng),問答技術(shù)等基本概念無法反映自然語(yǔ)言問答系統(tǒng)的研究熱點(diǎn)及趨勢(shì),本文將這些概念進(jìn)行剔除。否則因其頻次過高,與其他概念的共現(xiàn)程度過高,會(huì)導(dǎo)致結(jié)果的分析和判斷出現(xiàn)偏差。

        (4)屬性描述整合:當(dāng)關(guān)鍵詞歸屬于某一概念時(shí),將該屬性關(guān)鍵詞合并到該概念。如將“問答對(duì)質(zhì)量”合并到“問答對(duì)”。

        3.2 關(guān)鍵詞詞頻分析

        通過以上關(guān)鍵詞篩選、整合之后,得到如表3所示的關(guān)鍵詞詞頻結(jié)果。

        表3 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)關(guān)鍵詞詞頻統(tǒng)計(jì)

        對(duì)于高頻詞的截取,目前尚無統(tǒng)一見解。如果選取關(guān)鍵詞范圍太小,則不能反映學(xué)科構(gòu)成情況;如果選取范圍太大,則會(huì)給共詞分析帶來不必要的干擾。目前,高頻關(guān)鍵詞的截取使用最多的方法是結(jié)合研究者的經(jīng)驗(yàn)在選詞個(gè)數(shù)和詞頻高度上平衡[2],如馬費(fèi)成等人選取了累計(jì)詞頻達(dá)62%的前69 個(gè)關(guān)鍵詞來表征我國(guó)數(shù)字信息資源領(lǐng)域的研究熱點(diǎn)[3],邱均平等人利用集中分散的“二八定律”,選取累計(jì)詞頻25.2%的前77個(gè)關(guān)鍵詞來表征我國(guó)圖書館學(xué)近十年的研究熱點(diǎn)[4],李武和董偉則選取了頻次不小于5的46個(gè)關(guān)鍵詞來代表我國(guó)開放存取研究的主題[5]。本研究延用此方法,選取詞頻在20 及以上的47 個(gè)高頻關(guān)鍵詞進(jìn)行研究熱點(diǎn)分析,這些關(guān)鍵詞基本上體現(xiàn)了自然語(yǔ)言問答系統(tǒng)領(lǐng)域的核心研究主題,如表4所示。

        表4 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)的高頻關(guān)鍵詞統(tǒng)計(jì)(部分)

        3.3 共詞分析

        如果兩個(gè)詞在眾多文獻(xiàn)中共現(xiàn)的頻次越高,則說明它們之間的關(guān)系越密切。揭示高頻關(guān)鍵詞之間的關(guān)系,則需要統(tǒng)計(jì)分析它們?cè)谕黄墨I(xiàn)中共現(xiàn)的次數(shù)及規(guī)律,即為共詞分析[6]。通過對(duì)文獻(xiàn)中這種詞對(duì)共現(xiàn)的量化分析,能夠初步揭示研究主題之間的關(guān)聯(lián),進(jìn)一步發(fā)現(xiàn)學(xué)科熱點(diǎn)。因此,可考慮通過構(gòu)建這些高頻關(guān)鍵詞的共現(xiàn)矩陣來找出自然語(yǔ)言問答系統(tǒng)研究領(lǐng)域的核心詞匯,通過對(duì)這些詞匯進(jìn)行理解和表征,能夠更清晰地理解該研究領(lǐng)域研究熱點(diǎn)之間的關(guān)系。上文中表4 所統(tǒng)計(jì)出來的47個(gè)高頻關(guān)鍵詞基本上涵蓋了自然語(yǔ)言問答系統(tǒng)研究的主要方向,能夠基本反映出該領(lǐng)域的研究熱點(diǎn)。對(duì)這47個(gè)高頻詞的共現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),構(gòu)建出高頻關(guān)鍵詞共現(xiàn)矩陣,表5所示為部分關(guān)鍵詞(10個(gè))構(gòu)成的共現(xiàn)矩陣。

        表5 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)關(guān)鍵詞共現(xiàn)矩陣(部分)

        由于表5 中共現(xiàn)矩陣中的關(guān)鍵詞兩兩共現(xiàn)詞頻是絕對(duì)詞頻,無法客觀反映出關(guān)鍵詞之間的依賴程度。本研究對(duì)詞頻進(jìn)行包容化處理,將絕對(duì)詞頻轉(zhuǎn)化為相對(duì)詞頻,以明確關(guān)鍵詞之間的緊密聯(lián)系程度。在目前研究中,包容化處理的方法主要有包容指數(shù)法、臨近指數(shù)法、相互包容系數(shù)法等[1]10-16。目前使用較廣泛的是Ochiia 系數(shù)法,公式為:

        其中,Cij表示詞i與詞j在文獻(xiàn)集合中的共現(xiàn)次數(shù),Ci表示詞i的出現(xiàn)次數(shù),Cj表示詞j的出現(xiàn)次數(shù),Oij是經(jīng)包容化處理后的相對(duì)共現(xiàn)頻率。經(jīng)包容化處理后,使用絕對(duì)詞頻的共現(xiàn)矩陣轉(zhuǎn)換為使用相對(duì)詞頻的相關(guān)矩陣,如表6所示。在相關(guān)矩陣中,數(shù)值大小反映關(guān)鍵詞間的相關(guān)程度,數(shù)值越大,相關(guān)性越強(qiáng)。

        表6 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)關(guān)鍵詞相關(guān)矩陣(部分)

        由于相關(guān)矩陣中的0值過多,統(tǒng)計(jì)時(shí)容易造成誤差過大,為了方便進(jìn)一步處理,用1與相關(guān)矩陣中的全部數(shù)據(jù)進(jìn)行相減(相異矩陣=1-相似矩陣),得到表示兩詞間相依程度的相異矩陣,如表7所示。相異矩陣中的數(shù)據(jù)表示不相似數(shù)據(jù),數(shù)值越大表明關(guān)鍵詞之間的關(guān)系越遠(yuǎn),相關(guān)度越差;反之,數(shù)值越小表明關(guān)鍵詞之間的關(guān)系越近,相關(guān)度越高。

        表7 自然語(yǔ)言問答系統(tǒng)領(lǐng)域關(guān)鍵詞相異矩陣(部分)

        共詞聚類分析是共詞分析中常用的一種方法,在共詞分析的基礎(chǔ)上,以詞的共現(xiàn)頻率為研究對(duì)象,利用聚類方法,把眾多分析對(duì)象之間復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化成書目相對(duì)較少的類團(tuán)之間的關(guān)系[7]。通過聚類分析,能夠發(fā)現(xiàn)關(guān)系緊密的關(guān)鍵詞構(gòu)成的相對(duì)獨(dú)立的類團(tuán),這些類團(tuán)能夠反映學(xué)科領(lǐng)域的研究主題。

        層次聚類是聚類分析中的經(jīng)典方法。本文采用SPSS 統(tǒng)計(jì)軟件,利用高頻關(guān)鍵詞共現(xiàn)的相異矩陣進(jìn)行自下而上的層次化聚類分析,在SPSS 中選擇離差平方和聚類方法(Ward 法),距離測(cè)度選擇區(qū)間數(shù)據(jù)類型(count)中的Euclidean 方法。聚類后得到5大類,如表8所示。

        表8 自然語(yǔ)言問答系統(tǒng)研究文獻(xiàn)關(guān)鍵詞聚類結(jié)果

        經(jīng)過聚類分析,目前自然語(yǔ)言問答系統(tǒng)的研究主題主要有問題分類、答案抽取、信息檢索、推理、機(jī)器學(xué)習(xí)等五大類。其中,問題分類主要涉及句法分析技術(shù)、命名實(shí)體識(shí)別、句子的語(yǔ)義分析以及分類方法,如支持向量機(jī)、隱馬爾科夫模型等;答案抽取主要涉及文本分析的技術(shù),如句子相似度、指代消解、特征提取等;信息檢索主要涉及檢索的方式和支持有效檢索的技術(shù),如文本檢索、語(yǔ)義角色標(biāo)注和語(yǔ)義相似度等;推理主要與知識(shí)庫(kù)、推理方式等關(guān)鍵詞共現(xiàn),如與知識(shí)庫(kù)相關(guān)的關(guān)鍵詞有“語(yǔ)料庫(kù)”“知識(shí)庫(kù)”“本體”,與推理方式相關(guān)的關(guān)鍵詞有“基于規(guī)則的推理”;機(jī)器學(xué)習(xí)類別主要涉及機(jī)器學(xué)習(xí)的技術(shù),如貝葉斯、條件隨機(jī)場(chǎng)等。

        4 自然語(yǔ)言問答系統(tǒng)主要應(yīng)用領(lǐng)域分析

        通過對(duì)CNKI 數(shù)據(jù)庫(kù)中2000—2020 年自然語(yǔ)言問答系統(tǒng)領(lǐng)域中的碩博論文整理分析,開發(fā)應(yīng)用的重要文獻(xiàn)主要集中于以下八大領(lǐng)域。

        (1)電子商務(wù)領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在該領(lǐng)域中的應(yīng)用主要有:在問句理解方面,中文領(lǐng)域基于模板自動(dòng)生成的語(yǔ)義解析方法[8];在知識(shí)庫(kù)構(gòu)建方面,知識(shí)表示模型的改進(jìn)以及知識(shí)自動(dòng)融合和補(bǔ)全的方法;在商品咨詢方面,將中文自然語(yǔ)言查詢轉(zhuǎn)換為基于SPARQL 查詢的方法[9]。這些問答系統(tǒng)的改進(jìn)方法應(yīng)用在電子商務(wù)領(lǐng)域可提高了商品的查準(zhǔn)率和查全率。

        (2)財(cái)經(jīng)領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在財(cái)經(jīng)領(lǐng)域的應(yīng)用有:以維基百科為知識(shí)來源構(gòu)建金融領(lǐng)域的自動(dòng)問答系統(tǒng)[10],識(shí)別財(cái)經(jīng)領(lǐng)域中的股票名稱、股票代碼等命名實(shí)體的問答系統(tǒng)[11],以問句后續(xù)解析為主的查詢子系統(tǒng)[12]、問句解析子系統(tǒng)[13],面向金融領(lǐng)域的網(wǎng)友問答子系統(tǒng)和自動(dòng)問答子系統(tǒng)[14]以及企業(yè)問答系統(tǒng)[15]。

        (3)醫(yī)療領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在醫(yī)療領(lǐng)域中的應(yīng)用有基于多次推斷的自動(dòng)化醫(yī)療疾病診斷系統(tǒng)[16]、中草藥問答系統(tǒng)[17]、基于中草藥語(yǔ)義網(wǎng)的自動(dòng)問答系統(tǒng)[18]、基于垂直領(lǐng)域問答的醫(yī)療健康領(lǐng)域問答系統(tǒng)[19]、孕婦保健智能語(yǔ)音手機(jī)問答系統(tǒng)[20]以及基于疾病知識(shí)圖譜的問答系統(tǒng)[21]。

        (4)旅游領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在旅游業(yè)領(lǐng)域的應(yīng)用有:維護(hù)用戶多次輸入文本的上下相關(guān)性的問答系統(tǒng)[22],由模式匹配、句子相似度計(jì)算、旅游景點(diǎn)推薦、信息檢索和答案獲取等模塊組成的面向中文旅游領(lǐng)域的問答系統(tǒng)[23],基于本體知識(shí)庫(kù)模型,并采用SPARQL 查詢語(yǔ)言和Jena包來完成對(duì)知識(shí)的推理和答案的抽取的問答系統(tǒng)[24]。

        (5)教育領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在教育領(lǐng)域的應(yīng)用有:構(gòu)建以某一門課程為知識(shí)庫(kù)或本體的問答系統(tǒng),如基于互聯(lián)網(wǎng)資源的本體自動(dòng)構(gòu)建技術(shù),實(shí)現(xiàn)了《C程序設(shè)計(jì)》課程本體的自動(dòng)構(gòu)建并應(yīng)用于答疑系統(tǒng)[25];以《計(jì)算機(jī)操作系統(tǒng)》學(xué)科的領(lǐng)域知識(shí)庫(kù)為基礎(chǔ)設(shè)計(jì)自動(dòng)問答系統(tǒng)[26];高考地理在線解答系統(tǒng)[27];自動(dòng)解答高中地理因果推理類試題問題的系統(tǒng)[28];基于中國(guó)歷史人物(基于Android 平臺(tái))的自動(dòng)問答系統(tǒng)[29];基于《論語(yǔ)》的問答系統(tǒng)[30];入學(xué)咨詢的中文問答系統(tǒng)[31];面向國(guó)家科技計(jì)劃項(xiàng)目申報(bào)信息咨詢的自動(dòng)問答原型系統(tǒng)[32];基于《數(shù)據(jù)庫(kù)系統(tǒng)原理》課程知識(shí)庫(kù)的中文問答系統(tǒng)[33];虛擬學(xué)術(shù)社區(qū)[34]。

        (6)人工智能領(lǐng)域。問答系統(tǒng)在人工智能領(lǐng)域的應(yīng)用有人機(jī)情感交互行為一致性協(xié)同控制模型[35]、面向智能家居的交互系統(tǒng)[36]、基于大學(xué)計(jì)算機(jī)系教師信息的問答系統(tǒng)[37]、采筑智能問答平臺(tái)[38]以及視覺問答系統(tǒng)。

        (7)社區(qū)問答領(lǐng)域。自然語(yǔ)言問答系統(tǒng)在社區(qū)問答系統(tǒng)領(lǐng)域的應(yīng)用主要有基于社區(qū)問答系統(tǒng)(CQA)的答案摘要系統(tǒng)[39]、社區(qū)問答檢索系統(tǒng)[40]、基于全信息的社區(qū)問答原型系統(tǒng)[41]。

        (8)其他領(lǐng)域。自然語(yǔ)言問答系統(tǒng)還應(yīng)用在圖書館領(lǐng)域[42]、農(nóng)業(yè)領(lǐng)域[43]、數(shù)字人文領(lǐng)域[44]等。

        5 結(jié)論與展望

        自然語(yǔ)言問答系統(tǒng)是一種基于自然語(yǔ)言處理的應(yīng)用系統(tǒng)。該系統(tǒng)包括自然語(yǔ)言處理及信息檢索和答案抽取等方面的基本技術(shù),如詞法分析、句法分析、文本檢索、語(yǔ)義解析、答案抽取等。目前,問題回答系統(tǒng)的研究已經(jīng)成為一個(gè)熱點(diǎn),它是信息檢索和自然語(yǔ)言處理的交叉研究方向。本文通過對(duì)現(xiàn)有自然語(yǔ)言問答系統(tǒng)的研究現(xiàn)狀進(jìn)行梳理,通過分析該領(lǐng)域的研究熱點(diǎn),為新的研究角度提供方向上的理論支持。本文通過文獻(xiàn)計(jì)量的方法對(duì)我國(guó)自然語(yǔ)言問答系統(tǒng)研究的學(xué)科領(lǐng)域分布、文獻(xiàn)的年度分布、機(jī)構(gòu)分布、高頻關(guān)鍵詞及基于關(guān)鍵詞共現(xiàn)的熱點(diǎn)主題進(jìn)行了分析。

        從學(xué)術(shù)方面看,分析結(jié)果表明計(jì)算機(jī)軟件及其應(yīng)用學(xué)科是自然語(yǔ)言問答系統(tǒng)的主要所屬學(xué)科,哈爾濱工業(yè)大學(xué)是該領(lǐng)域研究的領(lǐng)軍機(jī)構(gòu),自然語(yǔ)言問答系統(tǒng)的研究主題包括問題分類、答案抽取、信息檢索、推理以及機(jī)器學(xué)習(xí)等五大類。研究的核心主要是語(yǔ)言以及文本,語(yǔ)義、句法等研究的基礎(chǔ)仍然要依賴于語(yǔ)法、語(yǔ)義的研究。自然語(yǔ)言處理涉及計(jì)算機(jī)科學(xué)、人工智能以及語(yǔ)言學(xué)等多種學(xué)科,學(xué)科之間的交叉融合對(duì)于自然語(yǔ)言處理的發(fā)展起到良好的促進(jìn)作用。同時(shí),自然語(yǔ)言處理的發(fā)展也促進(jìn)了其他學(xué)科的發(fā)展,推動(dòng)部分傳統(tǒng)學(xué)科與自然語(yǔ)言相結(jié)合,促進(jìn)其他學(xué)科的不斷創(chuàng)新發(fā)展。提升計(jì)算機(jī)處理語(yǔ)言的能力,已經(jīng)成為人們未來研究的焦點(diǎn)。

        從目前的應(yīng)用角度看,自然語(yǔ)言問答系統(tǒng)已經(jīng)應(yīng)用到諸多領(lǐng)域,其應(yīng)用領(lǐng)域主要有電子商務(wù)、財(cái)經(jīng)、醫(yī)療、旅游、教育、人工智能、社區(qū)問答以及其他領(lǐng)域。自然語(yǔ)言處理的廣泛應(yīng)用的核心在于準(zhǔn)確地理解語(yǔ)言文本,而理解文本的難點(diǎn)不僅僅需要語(yǔ)法邏輯的正確,更重要的還需要依賴于豐富的知識(shí)庫(kù),兩者同時(shí)具備才能夠準(zhǔn)確地對(duì)文本進(jìn)行理解和分析。隨著技術(shù)的發(fā)展,各行各業(yè)對(duì)自然語(yǔ)言處理的需要逐漸增加并且對(duì)其準(zhǔn)確性要求也更高,如在一些銀行或醫(yī)學(xué)等領(lǐng)域?qū)ψ匀徽Z(yǔ)言處理的需要和要求都很高。其專業(yè)化服務(wù)是趨勢(shì)也是挑戰(zhàn),行業(yè)的不同,依賴的專業(yè)庫(kù)也不同,而專業(yè)庫(kù)的構(gòu)建工作是一項(xiàng)耗時(shí)耗力的工作,也是目前其發(fā)展的一個(gè)重點(diǎn)難點(diǎn)。未來可以考慮借助一些現(xiàn)有的顯性結(jié)構(gòu)化知識(shí),來理解知識(shí)庫(kù)設(shè)計(jì)到的語(yǔ)言成分之間的關(guān)系,逐漸走向自動(dòng)化構(gòu)建知識(shí)庫(kù),減輕人工的工作量。

        通過以上分析可發(fā)現(xiàn),雖然目前自然語(yǔ)言問答系統(tǒng)領(lǐng)域已有大量研究,無論是學(xué)術(shù)界還是產(chǎn)業(yè)界,提高計(jì)算機(jī)語(yǔ)言處理的準(zhǔn)確性等能力一直是大家關(guān)注的焦點(diǎn)。但自然語(yǔ)言問答系統(tǒng)在中文處理方面的精確率上的處理技術(shù)研究還不夠成熟,如分詞、實(shí)體識(shí)別、外來語(yǔ)識(shí)別和一詞多義等,導(dǎo)致大部分問答系統(tǒng)的準(zhǔn)確率還比較低,對(duì)文本的深層語(yǔ)義理解還不夠準(zhǔn)確,無法真正地理解自然語(yǔ)言問題。因此,未來的研究可以是自然語(yǔ)言處理技術(shù),從而推動(dòng)自然語(yǔ)言問答系統(tǒng)在中文處理研究的進(jìn)一步發(fā)展??山梃bGoogle推出的一種深入探索自然語(yǔ)言理解的測(cè)試機(jī)平臺(tái),即首先讓計(jì)算機(jī)對(duì)某個(gè)文章進(jìn)行理解,再由人們對(duì)計(jì)算機(jī)進(jìn)行提問測(cè)試其理解能力和準(zhǔn)確性能。

        猜你喜歡
        詞頻知識(shí)庫(kù)領(lǐng)域
        基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
        園林科技(2021年3期)2022-01-19 03:17:48
        領(lǐng)域·對(duì)峙
        青年生活(2019年23期)2019-09-10 12:55:43
        基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
        高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
        基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
        圖書館研究(2015年5期)2015-12-07 04:05:48
        詞頻,一部隱秘的歷史
        云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
        新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
        以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報(bào)》學(xué)術(shù)研究特色
        圖書館論壇(2014年8期)2014-03-11 18:47:59
        肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
        一区二区三区视频偷拍| 国产乱子轮xxx农村| 日韩精品成人无码专区免费| 男女啪动最猛动态图| 六月婷婷久香在线视频| 免费无码成人av在线播| 一区二区三区国产高潮| 国产精品亚洲一二三区| 久久中文字幕人妻淑女| 国产高清av在线播放| 中文字幕熟妇人妻在线视频| 91伊人久久| 少妇bbwbbw高潮| 精品成人av人一区二区三区 | 日本在线一区二区三区视频观看| 国产人妻鲁鲁一区二区| 久久精品成人一区二区三区| 狠狠色狠狠色综合| 精品乱子伦一区二区三区| 最新国产成人自拍视频| 国产精品偷窥熟女精品视频| 中文无码日韩欧| 日韩高清无码中文字幕综合一二三区| 人妻系列影片无码专区| 可以直接在线看国产在线片网址| 国产精品高清一区二区三区不卡| 精品无码国产自产野外拍在线| 国产在线欧美日韩精品一区二区| 国产免费的视频一区二区| 一区二区三区四区国产亚洲| 插入日本少妇一区二区三区| 乱人伦人妻中文字幕无码| 亚洲色欲大片AAA无码| 亚洲国产精品免费一区| 极品粉嫩小仙女高潮喷水操av| 亚洲开心婷婷中文字幕| 午夜不卡av免费| 国产伦码精品一区二区| 亚洲精品一区三区三区在线| 成人免费无码大片a毛片软件| 一本大道久久精品 东京热|