亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的虛擬學(xué)術(shù)社區(qū)智能問答研究*

        2021-04-29 04:41:28徐彤陽
        情報(bào)雜志 2021年4期
        關(guān)鍵詞:智能用戶信息

        徐彤陽 滕 琦

        (山西財(cái)經(jīng)大學(xué) 信息學(xué)院 太原 030006)

        0 引 言

        學(xué)術(shù)交流是科研人員科研活動(dòng)不可缺少的一部分,是促進(jìn)學(xué)術(shù)繁榮和技術(shù)創(chuàng)新的必要條件。信息化時(shí)代,互聯(lián)網(wǎng)改變了學(xué)術(shù)資源獲取的方式,高度的開放性和交互性的虛擬學(xué)術(shù)社區(qū),為科研人員搭建了一個(gè)信息搜索、信息共享和信息創(chuàng)新的平臺(tái),針對(duì)特定的專業(yè)領(lǐng)域,促進(jìn)科研人員知識(shí)再造,有效發(fā)揮知識(shí)增值功能。社區(qū)內(nèi)的學(xué)術(shù)資源和研究成果具有綜合性、專業(yè)性、創(chuàng)新性和前沿性,已經(jīng)成為Web流行的信息來源。大數(shù)據(jù)環(huán)境下,學(xué)術(shù)資源的知識(shí)管理和知識(shí)服務(wù)方式需要?jiǎng)?chuàng)新,以幫助科研人員快速、準(zhǔn)確在虛擬學(xué)術(shù)平臺(tái)獲取想要的專業(yè)知識(shí)。結(jié)合人工智能等技術(shù)有助于解決網(wǎng)絡(luò)信息無序與人們對(duì)文獻(xiàn)信息的特定需要之間的矛盾,有助于整理、優(yōu)化復(fù)雜的知識(shí)體系。智能問答為如何整合信息資源,提高信息資源利用率,為用戶減少查詢時(shí)間,提供準(zhǔn)確信息提供了方向,提高社區(qū)問答的易用性和可接受的答案周轉(zhuǎn)時(shí)間。

        智能問答服務(wù)是一種界面,使用戶以自然的方式與智能設(shè)備進(jìn)行交互,用戶提出的自然語言問題靈活多變以及語義信息的復(fù)雜抽象,深度學(xué)習(xí)優(yōu)異的表示學(xué)習(xí)能力應(yīng)用于自然語言處理任務(wù),實(shí)現(xiàn)智能問答中問句及答案的語義表征,基于后臺(tái)知識(shí)庫輸出可能的答案列表,并對(duì)用戶查詢提供單一的響應(yīng)。與傳統(tǒng)的搜索引擎會(huì)返回?cái)?shù)萬條結(jié)果,依靠用戶甄別,得出結(jié)論的檢索方式相比,智能問題增強(qiáng)了用戶獲取知識(shí)的便捷性,節(jié)省信息篩選時(shí)間,提高信息質(zhì)量。問答系統(tǒng)能更好地理解用戶提問的真實(shí)意圖,直接返回簡單而準(zhǔn)確的答案而不是相關(guān)的網(wǎng)頁,有效滿足用戶的信息需求。智能問答可以滿足用戶對(duì)高質(zhì)量信息的需求,完善虛擬社區(qū)的知識(shí)服務(wù)和創(chuàng)新發(fā)展,使得虛擬學(xué)術(shù)平臺(tái)具有較強(qiáng)的知識(shí)關(guān)聯(lián)性,用戶檢索頁更加智能化、個(gè)性化和優(yōu)質(zhì)化。以虛擬學(xué)術(shù)社區(qū)作為研究對(duì)象,彌補(bǔ)社區(qū)知識(shí)服務(wù)的不足,研究面向知識(shí)服務(wù)的智能問答。將聚合的學(xué)術(shù)資源融入智能問答中,在網(wǎng)絡(luò)上建立檢索效率更高、實(shí)用性更強(qiáng)的虛擬學(xué)術(shù)空間,充分挖掘用戶的意圖與需求,獲取用戶現(xiàn)實(shí)的查詢需求對(duì)正確檢索,提升知識(shí)服務(wù)。虛擬環(huán)境下將智能問答系統(tǒng)與虛擬學(xué)術(shù)社區(qū)相結(jié)合,預(yù)先設(shè)定問答模型與虛擬角色,與用戶進(jìn)行自然溝通。本文基于深度學(xué)習(xí)技術(shù),針對(duì)智能問答的難點(diǎn),提出基于深度學(xué)習(xí)的虛擬社區(qū)的智能問答服務(wù)模型,解決以下3方面的理論問題:①目前虛擬學(xué)術(shù)社區(qū)知識(shí)服務(wù)現(xiàn)狀?②虛擬學(xué)術(shù)社區(qū)智能問答服務(wù)的設(shè)計(jì)框架?③如何基于深度學(xué)習(xí)構(gòu)建問答模型,實(shí)現(xiàn)虛擬學(xué)術(shù)社區(qū)的智能問答服務(wù)模型?

        1 虛擬學(xué)術(shù)社區(qū)相關(guān)研究

        以Rheingold[1]提出虛擬社區(qū)概念為起點(diǎn),開啟了虛擬社區(qū)的研究。虛擬學(xué)術(shù)社區(qū)是虛擬社區(qū)的一個(gè)特殊類型。李立軍等[2]運(yùn)用文獻(xiàn)計(jì)量法和CiteSpace可視化軟件對(duì)虛擬學(xué)術(shù)社區(qū)定量化分析,多維度呈現(xiàn)國內(nèi)外虛擬學(xué)術(shù)社區(qū)研究進(jìn)展,宏觀上揭示其研究現(xiàn)狀及研究熱點(diǎn),多集中于基礎(chǔ)理論和實(shí)踐研究。學(xué)者們從理論方面論證虛擬學(xué)術(shù)社區(qū)框架內(nèi)涵、主體和平臺(tái)類型、信息特征等內(nèi)容。日本學(xué)者Keiko Kurata[3]在醫(yī)學(xué)、化學(xué)、物理三個(gè)領(lǐng)域發(fā)放1 810份問卷,調(diào)查結(jié)果表明越來越多的學(xué)者開始利用網(wǎng)絡(luò)電子期刊平臺(tái)進(jìn)行學(xué)術(shù)交流,即使僅限于傳統(tǒng)信息獲取方式的補(bǔ)充。結(jié)合學(xué)者的研究,付立宏等[4]界定了虛擬學(xué)術(shù)社區(qū)的內(nèi)涵與外延,并分析其類型及特點(diǎn)。目前,虛擬學(xué)術(shù)社區(qū)尚未形成明確的定義,但內(nèi)涵強(qiáng)調(diào)了其學(xué)術(shù)性質(zhì),利用互聯(lián)網(wǎng)平臺(tái),科研人員進(jìn)行信息發(fā)布、學(xué)術(shù)互動(dòng)、知識(shí)共享與交流的開放性社區(qū)。許美峰等[5]豐富了虛擬學(xué)術(shù)社區(qū)的內(nèi)涵,基于特定專業(yè)主題開展學(xué)術(shù)信息交流活動(dòng)的專業(yè)社區(qū)。從三方面闡述社區(qū)范疇:一是以服務(wù)學(xué)術(shù)研究為目的,二是以特定領(lǐng)域的研究為交流內(nèi)容,三是穩(wěn)定的專業(yè)用戶群體。實(shí)踐方面關(guān)于虛擬學(xué)術(shù)社區(qū)的研究主要集中于用戶知識(shí)交流行為意愿與效率,知識(shí)共享實(shí)現(xiàn)與模式,平臺(tái)技術(shù)架構(gòu)與知識(shí)聚合等方面的成果。

        1.1用戶行為層面多數(shù)文獻(xiàn)以虛擬學(xué)術(shù)社區(qū)的用戶為研究對(duì)象,主要為高校學(xué)生和科研人員,關(guān)注在線用戶的各類信息行為。學(xué)者闡述研究視角不同,用戶主體類型劃分也有差異。孫思陽[6]以虛擬學(xué)術(shù)社區(qū)用戶知識(shí)交流行為為研究文獻(xiàn),運(yùn)用文獻(xiàn)計(jì)量方法歸納分析了研究進(jìn)展?fàn)顩r。虛擬學(xué)術(shù)社區(qū)具有獨(dú)特性,不同場景和情境下用戶交互行為不同,有的側(cè)重研究用戶信息行為,深度把握用戶行為規(guī)律,激發(fā)虛擬學(xué)術(shù)社區(qū)的知識(shí)共享和交流。王戰(zhàn)平等[7]依據(jù)扎根理論分析虛擬學(xué)術(shù)社區(qū)中用戶參與行為類型,以小木蟲為例,構(gòu)建參與用戶行為模型。有的社區(qū)以咨詢?yōu)橹鲗で笊鐣?huì)和情感支持,賈明霞等[8]以科研用戶真實(shí)的心理和行為變化的動(dòng)態(tài)過程為研究對(duì)象,以S-O-R模型和MOA理論為框架構(gòu)建研究模型,探究虛擬學(xué)術(shù)社區(qū)知識(shí)交流與知識(shí)共享刺激因素引起行為。盧恒等[9]結(jié)合運(yùn)用內(nèi)容分析、LDA主題模型和社會(huì)網(wǎng)絡(luò)分析方法,從會(huì)話交互內(nèi)容和關(guān)系兩個(gè)維度揭示虛擬學(xué)術(shù)社區(qū)的用戶交互特征。

        1.2知識(shí)交流與共享層面縱觀相關(guān)虛擬學(xué)術(shù)社區(qū)細(xì)分領(lǐng)域中多數(shù)研究知識(shí)共享,如知識(shí)共享意愿和影響因素[10]、知識(shí)共享過程機(jī)制[11]、知識(shí)交流影響因素[12]等。劉虹等[13]基于MOA理論,從動(dòng)機(jī)、機(jī)會(huì)、能力三個(gè)維度揭示知識(shí)共享意愿。從過程視角來看,學(xué)者知識(shí)匹配關(guān)系形成后的知識(shí)活動(dòng)。Chiu C M等[14]綜合預(yù)期不確定理論和社會(huì)正義理論,構(gòu)建開放專業(yè)虛擬社區(qū)知識(shí)共享背后動(dòng)機(jī)的模型。許林玉等[15]以經(jīng)管之家實(shí)證分析,Python回歸研究知識(shí)共享影響因素。

        1.3技術(shù)構(gòu)建層面構(gòu)建虛擬學(xué)術(shù)社區(qū)的目的是為科學(xué)研究服務(wù),針對(duì)用戶群體為科研人員,為滿足自主和協(xié)作式學(xué)習(xí)服務(wù),主題圖(Topic Map)[16]將知識(shí)個(gè)體融入社會(huì),構(gòu)建知識(shí)專家學(xué)術(shù)社區(qū)實(shí)現(xiàn)協(xié)同合作,基于Web的網(wǎng)絡(luò)社區(qū)[17]支持用戶在專業(yè)領(lǐng)域內(nèi)以興趣組建群體。Web2.0下,章穎華等[18]探討了Web2.0技術(shù)如何應(yīng)用到虛擬學(xué)術(shù)社區(qū),利用Web2.0的理念和技術(shù)構(gòu)建虛擬學(xué)術(shù)社區(qū)的體系框架。黃雅文[19]從應(yīng)用角度,設(shè)計(jì)與云計(jì)算結(jié)合構(gòu)建學(xué)術(shù)社區(qū)概念模型。信息技術(shù)的更迭,將云計(jì)算[20]引入到虛擬學(xué)術(shù)社區(qū)的建設(shè)中,宏觀層面構(gòu)建基于云共享的虛擬學(xué)術(shù)社區(qū)的理論模型,豐富和完善了虛擬社區(qū)構(gòu)建的理論體系。社區(qū)內(nèi)知識(shí)聚合的構(gòu)建也是近幾年的研究熱點(diǎn)。商憲麗等[21]以平臺(tái)資源為切入點(diǎn),通過語義和內(nèi)容關(guān)聯(lián)挖掘關(guān)聯(lián)標(biāo)簽?;跇?biāo)簽共現(xiàn)實(shí)現(xiàn)資源聚合。為提高知識(shí)服務(wù),盧恒[22]構(gòu)建知識(shí)圖譜對(duì)學(xué)術(shù)資源深度聚合,肖璐[23]以知識(shí)資源的聚合粒度為研究點(diǎn),考慮跨粒度的問題,以單個(gè)或多個(gè)知識(shí)子網(wǎng)絡(luò)為基礎(chǔ)構(gòu)建網(wǎng)絡(luò)學(xué)術(shù)社區(qū)的知識(shí)超網(wǎng)絡(luò)。針對(duì)多個(gè)平臺(tái)的學(xué)術(shù)資源,陶興[24]提出跨平臺(tái)的知識(shí)聚合,建立不同學(xué)術(shù)社區(qū)的知識(shí)關(guān)聯(lián),滿足科研人員深層次的知識(shí)需求。除了技術(shù)導(dǎo)向的學(xué)術(shù)社區(qū)的構(gòu)建研究,趙青[25]從地區(qū)出發(fā)分析了學(xué)術(shù)型網(wǎng)絡(luò)社區(qū)的三個(gè)構(gòu)建條件,包括交流手段、社區(qū)主題和合理規(guī)范。

        目前虛擬學(xué)術(shù)社區(qū)內(nèi)部主體互動(dòng)機(jī)制理論研究成果最為豐富,即用戶行為、知識(shí)共享與傳播方面的研究。技術(shù)層面主要關(guān)注學(xué)術(shù)資源的知識(shí)聚合,但是知識(shí)服務(wù)的研究尚不深入,缺乏對(duì)虛擬學(xué)術(shù)社區(qū)構(gòu)建的實(shí)際應(yīng)用,不利于用戶實(shí)現(xiàn)知識(shí)共享和經(jīng)驗(yàn)交流。如何利用特定的技術(shù)手段創(chuàng)新和完善虛擬社區(qū)的知識(shí)服務(wù),有待進(jìn)一步的探索,具體的應(yīng)用研究如智能問答,提升已有的學(xué)術(shù)資源工具的效率,分析虛擬社區(qū)現(xiàn)狀不足的基礎(chǔ)上,構(gòu)建智能問答模型。

        2 探析虛擬學(xué)術(shù)社區(qū)的知識(shí)服務(wù)

        知識(shí)經(jīng)濟(jì)時(shí)代,虛擬學(xué)術(shù)社區(qū)以輕松自由的環(huán)境迎合了高校學(xué)生和科研人員多途徑、多層次獲取新知識(shí)、新技能的知識(shí)需求,隨時(shí)隨地動(dòng)態(tài)學(xué)術(shù)交流,有助于信息共享、知識(shí)發(fā)現(xiàn)與科研創(chuàng)新。但社區(qū)的學(xué)術(shù)交流與知識(shí)共享活動(dòng)依靠技術(shù)要素和知識(shí)要素[26]的協(xié)同建設(shè)與實(shí)施。知識(shí)要素包括學(xué)術(shù)知識(shí)資源、參與主體和知識(shí)共享環(huán)境。技術(shù)要素主要包括現(xiàn)代信息技術(shù)手段和應(yīng)用人才,以知識(shí)要素需求為導(dǎo)向。當(dāng)前的學(xué)術(shù)社區(qū)也面臨著技術(shù)陳舊、服務(wù)理念落后而無法盡善盡美適應(yīng)科研群體開展學(xué)術(shù)研究的諸多問題,如缺乏知識(shí)資源整合、實(shí)時(shí)互動(dòng)渠道與主動(dòng)服務(wù)手段等。

        2.1缺乏知識(shí)資源整合良好的虛擬學(xué)術(shù)社區(qū)依靠用戶促進(jìn)搜索與回答。社區(qū)用戶貢獻(xiàn)自身知識(shí),平臺(tái)內(nèi)容持續(xù)更新,有效的學(xué)術(shù)資源開放存取的交流方式一定程度上滿足科研人員知識(shí)數(shù)量上的獲取,并不能保證科研人員獲得恰當(dāng)、滿意的知識(shí)內(nèi)容。

        社區(qū)內(nèi)資源資源呈現(xiàn)方式多樣性差,主要以主題帖和學(xué)術(shù)論文形式存在,兼有學(xué)術(shù)咨詢、學(xué)術(shù)博客。學(xué)術(shù)論文的文獻(xiàn)資源內(nèi)容比較集中,價(jià)值度較高。而主題帖的論壇式交流由于用戶本身的學(xué)術(shù)水平、專業(yè)知識(shí)與能力良莠不齊,用戶提問語言表達(dá)具有靈活性,學(xué)術(shù)回答存在不確定性,用戶交互具有隨意性,無法完全保證學(xué)術(shù)質(zhì)量與價(jià)值,會(huì)積累以<問題,答案>方式存在的知識(shí),還充斥了許多與學(xué)術(shù)無關(guān)的話題。社區(qū)內(nèi)用戶生成內(nèi)容冗余、數(shù)據(jù)量大、知識(shí)點(diǎn)分散、數(shù)據(jù)稀疏、規(guī)范性差且信息質(zhì)量良莠不齊,用戶通過檢索來呈現(xiàn)學(xué)術(shù)資源,結(jié)果多而雜且不準(zhǔn)確、模糊,高失敗率和低知識(shí)質(zhì)量將影響社區(qū)用戶的知識(shí)交流,激發(fā)了高效的知識(shí)發(fā)現(xiàn)策略的需求。

        提高社區(qū)知識(shí)利用率最直接的方式就是對(duì)用戶生成內(nèi)容文本進(jìn)行知識(shí)聚合,構(gòu)建一個(gè)全面而豐富的知識(shí)庫。限定域關(guān)聯(lián)的知識(shí)庫為智能問答架構(gòu)更深層次的語義解析模型提供了底層資源支持。問答系統(tǒng)提供了人類和計(jì)算機(jī)之間的自然語言交互,并允許從非結(jié)構(gòu)化數(shù)據(jù)集檢索這些答案,以準(zhǔn)確的回答幫助社區(qū)內(nèi)的用戶快速獲取專業(yè)知識(shí),打破用戶資源利用的屏障,節(jié)省時(shí)間成本,提高科研效率,提升知識(shí)服務(wù)。知識(shí)庫服務(wù)于學(xué)術(shù)平臺(tái),科研人員對(duì)專業(yè)內(nèi)容的精準(zhǔn)度要求高,強(qiáng)調(diào)專業(yè)知識(shí)的描述粒度,需要梳理歸納知識(shí),重新組織后架構(gòu)到領(lǐng)域詞典。學(xué)術(shù)領(lǐng)域?qū)I(yè)詞匯多,問句復(fù)雜模糊,中英文混雜、口語化等,基于深度學(xué)習(xí)的智能問答問句的語義理解能力強(qiáng),幫助科研人員獲得全面而準(zhǔn)確的專業(yè)查詢。

        2.2缺乏實(shí)時(shí)檢索渠道作為虛擬學(xué)術(shù)的實(shí)時(shí)交流社區(qū)——問答社區(qū),用戶具有知識(shí)的需求者和提供者雙重身份,生成具有知識(shí)價(jià)值的用戶生成內(nèi)容。用戶由于個(gè)人信息能力的欠缺和社區(qū)大環(huán)境的繁雜,為咨詢學(xué)術(shù)而提出問題尋求解答或用戶針對(duì)其他用戶提出問題,依據(jù)自己的經(jīng)驗(yàn)給予答案?;诨ヂ?lián)網(wǎng)技術(shù)構(gòu)建的虛擬學(xué)術(shù)社區(qū)用戶針對(duì)感興趣的主題探討或?qū)⑿枨蟮膶W(xué)術(shù)知識(shí)發(fā)布為問題,擴(kuò)大學(xué)術(shù)交流的點(diǎn)和面。

        圖1 智能問答框架圖

        科研人員的知識(shí)需求、尋求幫助等活動(dòng)并不具有時(shí)間上的固定性和規(guī)律性。論壇、問答社區(qū)互動(dòng)的模式具有滯后性。其次,科研人員中可能只關(guān)注感興趣的或海量信息中沒機(jī)會(huì)看到的問題,不能實(shí)時(shí)有效地幫助科研支持活動(dòng)或科研人員,影響學(xué)術(shù)交流和知識(shí)共享。虛擬學(xué)術(shù)社區(qū)需要提供多樣化的交流途徑。智能問答與學(xué)術(shù)服務(wù)相結(jié)合,實(shí)現(xiàn)學(xué)術(shù)問題的實(shí)時(shí)準(zhǔn)確回答,為科研人員提供便捷的學(xué)術(shù)服務(wù)。利用自然語言處理、搜索技術(shù)及深度學(xué)習(xí)實(shí)現(xiàn)智能問答系統(tǒng),有助于準(zhǔn)確刻畫用戶的真實(shí)需求,彌補(bǔ)基于關(guān)鍵詞的信息檢索,解決用戶的大量實(shí)時(shí)需求,幫助用戶快速定位有用信息。為提升已有答案的問題提供了便捷,增加信息的復(fù)用率,提高學(xué)術(shù)資源獲取效率。

        2.3缺乏主動(dòng)平臺(tái)服務(wù)虛擬學(xué)術(shù)社區(qū)扮演儲(chǔ)存、傳遞資源的角色,用戶主動(dòng)分享,平臺(tái)被動(dòng)服務(wù)??蒲腥藛T對(duì)知識(shí)獲取的意愿與自身的興趣、社區(qū)內(nèi)資源的滿意度等相關(guān),導(dǎo)致大多數(shù)社區(qū)分享的資源傳播受限,源于平臺(tái)缺乏主動(dòng)的用戶服務(wù)。社區(qū)內(nèi)知識(shí)服務(wù)以用戶為中心,需要面向問題解決的、主動(dòng)的服務(wù)方式。

        技術(shù)與需求的雙重推動(dòng)下,網(wǎng)絡(luò)開始向“個(gè)性、精準(zhǔn)、高效和智能”的時(shí)代轉(zhuǎn)變,虛擬學(xué)術(shù)社區(qū)中知識(shí)模式為多主體參與,檢索模式也在迭代中不斷演化和更新[27]。智能問答作為主動(dòng)服務(wù)模式出現(xiàn),將結(jié)構(gòu)化與非結(jié)構(gòu)化的學(xué)術(shù)資源整合,滿足多主體用戶共同的需求,對(duì)虛擬學(xué)術(shù)社區(qū)具有較強(qiáng)的應(yīng)用需求。通過輸入廣泛的自然語言檢索,以靈活的方式細(xì)化初始化查詢,增加信息確定性,消除找不到最佳結(jié)果的挫敗感,幫助平臺(tái)節(jié)約人力資源和提供智能化服務(wù)。

        3 虛擬學(xué)術(shù)社區(qū)智能問答模型構(gòu)建

        問答系統(tǒng)的目標(biāo)是在非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)收集中找到用戶問題的正確答案。為了提升虛擬學(xué)術(shù)社區(qū)信息冗余、實(shí)時(shí)檢索等問題與提高問答效率,從語義、語境和語言結(jié)構(gòu)方面更加智能化的語句識(shí)別,構(gòu)建基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)(CNN)的智能問答系統(tǒng),對(duì)學(xué)術(shù)資源內(nèi)容文檔進(jìn)行處理,試圖理解文檔,根據(jù)問題相似度創(chuàng)建深度神經(jīng)網(wǎng)絡(luò),進(jìn)行問答匹配文檔,找到類似于人類回答問題的精簡答案。既可以實(shí)現(xiàn)簡單的開放式問答,又可以實(shí)現(xiàn)專業(yè)復(fù)雜問題的問答。

        3.1構(gòu)建問答模型智能問答由知識(shí)庫、用戶輸入、問題處理、答案抽取和用戶輸出五個(gè)部分組成[28]。系統(tǒng)總體流程為:用戶自然語言輸入后,利用中文分詞技術(shù)對(duì)文本分詞,采用Word2vec構(gòu)建詞向量問答相似矩陣,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)構(gòu)造分類器進(jìn)行分類處理,構(gòu)建問答匹配算法,得到領(lǐng)域相關(guān)詞語,知識(shí)理解模塊識(shí)別問答請(qǐng)求的來源和類型鏈接到相對(duì)應(yīng)的知識(shí)庫模塊,再經(jīng)過分詞、關(guān)鍵詞篩選、自然語言處理語義分析等預(yù)處理以從知識(shí)庫或緩存中采集最準(zhǔn)確的答案,基于條件堆積場對(duì)查詢問句進(jìn)行實(shí)體標(biāo)注,將滿足實(shí)例化條件的匹配度最高的查詢作為匹配的查詢結(jié)果輸出,若無結(jié)果。則返回用戶“無查詢結(jié)果”,結(jié)束問答。同時(shí),將用戶的回答數(shù)據(jù)自動(dòng)保存、以用于數(shù)據(jù)庫的更新(見圖1)。

        3.1.1 知識(shí)庫 知識(shí)庫面向?qū)W術(shù)領(lǐng)域,數(shù)據(jù)的正確存儲(chǔ)是檢索用戶問題相關(guān)正確答案的必要手段。學(xué)術(shù)資源中專用名詞、新詞多,結(jié)合領(lǐng)域知識(shí)庫進(jìn)行分詞標(biāo)注構(gòu)建領(lǐng)域詞典[29]。 知識(shí)庫的知識(shí)借助于虛擬社區(qū)內(nèi)已經(jīng)形成的知識(shí)內(nèi)容進(jìn)行收集、整理、加工與聚合,形成知識(shí)領(lǐng)域全覆蓋,以滿足不同用戶的知識(shí)需求?;跇?gòu)建知識(shí)庫建立問答系統(tǒng),知識(shí)庫的搭建依賴于大量且充分的問答語料,但虛擬學(xué)術(shù)社區(qū)的資源語料具有不確定性,采用基于詞表的jieba分詞。利用自然語言規(guī)則,進(jìn)行詞性標(biāo)注與實(shí)體識(shí)別。從元素中提取知識(shí)單元,為每一個(gè)元素分配單詞類型,使用單詞嵌入對(duì)單詞進(jìn)行向量化以捕捉他們的意思。單詞通過一個(gè)隱藏層從稀疏投影到一個(gè)更低維的向量空間,按照單詞的維度對(duì)其語義特征進(jìn)行編碼。將原始數(shù)據(jù)通過預(yù)處理整合成格式規(guī)范的數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,形成訓(xùn)練數(shù)據(jù)所需的原始數(shù)據(jù)集。知識(shí)庫進(jìn)行前期分類的預(yù)處理,減少了問答響應(yīng)時(shí)間,增加了系統(tǒng)的可用性。

        3.1.2 用戶輸入 在友好的環(huán)境中,用戶與計(jì)算機(jī)問答系統(tǒng)進(jìn)行交互。接受用戶輸入的信息,即一個(gè)自然語言問題,答案將以文本格式顯示用戶查詢所需要的答案。用戶可以接受答案,或者如果用戶需要更多關(guān)于知識(shí)的信息,新的查詢將再次提供給系統(tǒng)。

        3.1.3 問題處理 問題處理是對(duì)用戶的查詢進(jìn)行基本的語言分析,包括問題的預(yù)處理、問題類型的識(shí)別與需要的答案類型。

        ①分詞:分詞是將用戶的查詢語句按照一定規(guī)則劃分,劃分的各部分可單獨(dú)處理,但每個(gè)元素需充分理解整個(gè)句子,中文分詞則較為困難,存在歧義詞、組合詞和新生詞,需要合理劃分才能使句意更加準(zhǔn)確。

        ②詞性標(biāo)注:為每個(gè)詞指定其詞性類別,例名詞、動(dòng)詞、形容詞、副詞、介詞、代詞和連接詞等,再將結(jié)果進(jìn)行關(guān)鍵詞與標(biāo)題詞的提取。

        ③刪除停用詞:停用詞是指無意義的詞,如語氣助詞、冠詞、介詞和連接詞等。刪除用戶查詢中非常常見,同時(shí)被認(rèn)為是有噪聲的詞,在自然語言處理任務(wù)之前除去停用詞,可以節(jié)省內(nèi)存、提高處理速度、提升方法的性能,

        ④領(lǐng)域詞典:用來創(chuàng)建用戶問題中的單詞和本體概念之間的映射。信息直接從數(shù)據(jù)源中獲取。

        ⑤問題分類:問題分類可以定義為根據(jù)給定問題的特征,將問題分配到一組預(yù)定義類別的任務(wù)。以問題為中心的分析改進(jìn)信息檢索,焦點(diǎn)是問題所搜索的屬性或?qū)嶓w。問題主題是問題所涉及的對(duì)象和事件。候選段落可以寬泛地定義為任何內(nèi)容。問答系統(tǒng)通常處理的問題分為兩類:事實(shí)性和非事實(shí)性。事實(shí)類問題可以用表達(dá)人名、時(shí)間、地點(diǎn)等單個(gè)單詞或短語回答;非事實(shí)類問題可以用表達(dá)定義、理由或方法的句子或段落來回答。根據(jù)用戶提問的文本,將具有相似語義的所有句子查找出來。

        3.1.4 答案抽取 查詢問題處理后,調(diào)用答案抽取模塊,即對(duì)信息檢索的結(jié)果使用提取技術(shù)來呈現(xiàn)答案。問題所要求的預(yù)期答案的識(shí)別通常是根據(jù)問題類型及其語言和語義信息進(jìn)行的,檢索相關(guān)知識(shí)庫,在用戶查詢與查詢知識(shí)庫中的預(yù)定義之間推斷語義縮小答案范圍,將相似問題集合中的所有答案進(jìn)行排序,選出最佳答案反給用戶。候選答案集是解決類似問題的最佳答案的集合?;卮鸬目尚哦扰c問題的相似性被考慮在內(nèi)。

        3.1.5 用戶輸出 將知識(shí)轉(zhuǎn)發(fā)給用戶,顯示問題結(jié)果。最終精簡答案反饋輸出給用戶,完成問答查詢流程。

        3.2基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)智能問答聚焦于詞級(jí)別的交互與語義信息,很少考慮專家學(xué)者在問題回答時(shí)需要的專業(yè)知識(shí),在問答匹配中利用領(lǐng)域知識(shí)挖掘問答對(duì)之間的交互信息?;谏疃葘W(xué)習(xí)的智能問答方式更具靈活性與適應(yīng)性,將明確或不明確的問句轉(zhuǎn)化為詞向量矩陣,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)來計(jì)算問題與知識(shí)庫事實(shí)間的相關(guān)性。卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型在文本分類領(lǐng)域有較好的效果,利用局部感知延伸至全局,更注重語義之間的匹配。虛擬學(xué)術(shù)社區(qū)基于深度學(xué)習(xí)的智能問答建立了用戶與專業(yè)知識(shí)間的關(guān)系。用戶將知識(shí)需求表達(dá)成問題,專家學(xué)者無需實(shí)時(shí)在線,系統(tǒng)主動(dòng)利用知識(shí)庫后臺(tái)檢索自動(dòng)回答,協(xié)助用戶快速尋找答案。利用卷積神經(jīng)網(wǎng)絡(luò)有效地將知識(shí)表示融入到問題與回答的表示中,豐富了問答和回答表示,提升了領(lǐng)域知識(shí)。注意力機(jī)制是根據(jù)對(duì)人類視覺研究提出,學(xué)習(xí)并確定重點(diǎn)關(guān)注的目標(biāo)區(qū)域,在有限的資源下關(guān)注最有效的信息。基于注意力機(jī)制的問答模式,有效利用領(lǐng)域詞典構(gòu)建知識(shí)庫刻畫問答對(duì)之間的豐富交互關(guān)系,學(xué)習(xí)問答對(duì)之間的潛在的交互語義信息,使用注意力機(jī)制[30]根據(jù)問題的上下文語義,推測(cè)出回答該問題時(shí)的邏輯,判別連接問答對(duì)的不同路徑之間的重要性,提升領(lǐng)域?qū)I(yè)知識(shí)的關(guān)聯(lián),提升智能問答的檢索效率。

        基于注意力機(jī)制的CNN實(shí)現(xiàn)限定領(lǐng)域復(fù)雜問答, CNN算法將問句進(jìn)行語義解析,分析問題結(jié)構(gòu)并轉(zhuǎn)化為一個(gè)符合問答(QA)域有意義的問題公式。構(gòu)建CNN分類器解決問題分類,在預(yù)定義的層次類別列表中找到高度相關(guān)的目標(biāo)問題類別,加入并行注意力支路提取顯著特征擴(kuò)大輸入感受野,提升重要特征影響力,降低非重要特征影響力[31]。

        3.2.1 利用CNN構(gòu)建分類器 分類器,從數(shù)據(jù)集中的問題生成問題特征向量,評(píng)估問題中詞的重要性,形成一組問題標(biāo)識(shí)詞,每一詞試圖表示問題的動(dòng)機(jī)。利用CNN構(gòu)建分類器,給定數(shù)據(jù)訓(xùn)練文本分類器模型,在用戶提出測(cè)試問題時(shí)可以將測(cè)試問題貼上類別標(biāo)簽,鎖定答案的知識(shí)范圍。CNN模型為:數(shù)據(jù)輸入層(采用基于統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型CBOW(詞袋模型)訓(xùn)練出詞向量矩陣。每個(gè)句子通過和雙向長短期記憶網(wǎng)絡(luò)(biLSTW)[32]層進(jìn)行變換,多次卷積過濾,得到句子的語義表示向量)。卷積層(卷積用于獲取句子在不同層次的信息。對(duì)輸入數(shù)據(jù)做模型訓(xùn)練,權(quán)值集合為卷積核,大小作為掃描感受野。通過卷積核的局部感知實(shí)現(xiàn)特征提取)。池化層(矩陣算法實(shí)現(xiàn)卷積核池化,以達(dá)到分類效果。經(jīng)過多次的卷積層與池化層的循環(huán),計(jì)算動(dòng)態(tài)值Cosine_Similarity表示句子相似度來提取歸類的答案。關(guān)鍵字集較短以相關(guān)類別貢獻(xiàn)擴(kuò)展關(guān)鍵詞更精確捕捉問題特征[33]。全連接層(結(jié)合隱藏狀態(tài)的上下文和前一層的注意向量來創(chuàng)建索引,成為全連接層的輸入,得出分類結(jié)果。)、輸出層(決定答案跨度的開始和結(jié)束索引)(見圖2)。

        圖2 CNN模型

        3.2.2 注意力機(jī)制 神經(jīng)注意模型廣泛應(yīng)用于神經(jīng)語言處理中的機(jī)器理解或問答?;谏疃葘W(xué)習(xí)的問答算法模型的注意力機(jī)制從眾多信息中聚焦關(guān)鍵信息,自我注意學(xué)習(xí)每對(duì)單詞之間的全局交互,獲得具有信息表征的句子特征,實(shí)現(xiàn)問答對(duì)與問題對(duì)語句的語義關(guān)聯(lián)和解析,提高卷積的表示能力(見圖3)。

        圖3 注意力機(jī)制

        其中,P是max_pooling,T是激活函數(shù)Tanh,Cosine Similarity表示QA輸出的語義表示向量進(jìn)行相似度計(jì)算。

        注意力機(jī)制允許模型考慮上下文和關(guān)聯(lián)句的語境影響,更有利于句子的特征捕獲與呈現(xiàn)。利用attention model[34]去計(jì)算問題的權(quán)重,學(xué)習(xí)答案向量,使向量包含更多與問題相關(guān)的信息量。公式如下:

        ma,q(t)=Wamha(t)+Wqmoq

        3.3問答示例智能問答系統(tǒng)允許對(duì)學(xué)術(shù)知識(shí)有疑問或想要了解學(xué)術(shù)知識(shí)的用戶提出關(guān)于領(lǐng)域概念的問題。

        ①用自然語言表達(dá)的用戶問題作為輸入,見圖4。

        圖4 問題輸入

        ②問題處理模塊處理自然語言問題,應(yīng)用分詞、詞性標(biāo)注、注釋和刪除停用詞等功能,將自然語言進(jìn)行標(biāo)記。問題處理模塊的輸出,見圖5。

        圖5 問題處理

        ③將原始的自然語言與預(yù)定義語句進(jìn)行相似度匹配,見圖6。

        圖6 問題相似度

        ④答案抽取,將結(jié)果反饋至用戶,見圖7。

        圖7 問答實(shí)例

        4 總結(jié)與展望

        隨著大數(shù)據(jù)和人工智能時(shí)代的到來,自然語言處理在專業(yè)領(lǐng)域發(fā)展迅速,運(yùn)用分類算法、詞向量、模糊匹配等技術(shù)實(shí)現(xiàn)智能問答,為科研人員獲取全面有效的學(xué)術(shù)信息提供了新途徑。從技術(shù)角度,虛擬學(xué)術(shù)社區(qū)是一個(gè)網(wǎng)絡(luò)應(yīng)用程序,依賴于計(jì)算機(jī)資源協(xié)調(diào)配合實(shí)現(xiàn)各項(xiàng)功能服務(wù)。社區(qū)功能的不斷豐富,智能問答的技術(shù)也需不斷提高。科研人員對(duì)某一學(xué)科領(lǐng)域深入化、專業(yè)化的研究,決定了其個(gè)性化知識(shí)服務(wù)方式。開發(fā)簡明清晰的智能問答系統(tǒng)、采用用戶普遍接受的界面設(shè)計(jì)風(fēng)格以及完善幫助系統(tǒng)來提升社區(qū)用戶使用虛擬學(xué)術(shù)社區(qū)的自我效能,降低用戶操作的復(fù)雜性。用戶語言復(fù)雜靈活、自然語義解析困難、算法模型偏離實(shí)際應(yīng)用等問題仍是智能問答的發(fā)展困境。知識(shí)庫越豐富,但知識(shí)之間缺乏關(guān)聯(lián),為了準(zhǔn)確識(shí)別知識(shí)點(diǎn)并匹配提問,需要?jiǎng)討B(tài)調(diào)整和維護(hù)大量的關(guān)鍵詞。精準(zhǔn)獲取信息逐漸成為傳統(tǒng)搜索引擎的主要矛盾,基于人工智能技術(shù)的高效化、精準(zhǔn)化、個(gè)性化問答系統(tǒng)成為發(fā)展主流。社區(qū)內(nèi)建立的各項(xiàng)技術(shù)措施和用戶使用的互相配合有效發(fā)揮系統(tǒng)運(yùn)行機(jī)制的作用,兩者相輔相成才能在最大化程度上保障社區(qū)安全、平穩(wěn)、有序的運(yùn)行。

        虛擬學(xué)術(shù)社區(qū)的交流多樣化依賴于互聯(lián)網(wǎng)技術(shù)的成熟與發(fā)展。學(xué)術(shù)交流信息內(nèi)容最常見的形式是科研人員以正式論文的方式表達(dá)學(xué)術(shù)見解或知識(shí),也有科研人員以自身知識(shí)和經(jīng)驗(yàn)為前提未成形或不成熟的個(gè)人觀點(diǎn)的簡單描述,并非一般社區(qū)中隨意發(fā)表的言論。因此,科研人員的語言文字帶有個(gè)人原創(chuàng)的烙印。社區(qū)內(nèi)的智能問答也需要建立切實(shí)可行且有約束力的保護(hù)措施,有效保護(hù)科研人員的知識(shí)產(chǎn)權(quán),提高科研人員對(duì)學(xué)術(shù)社區(qū)的信任度。智能問答為虛擬學(xué)術(shù)社區(qū)內(nèi)的科研人員獲取精準(zhǔn)信息資源的提供了新視角。在虛擬學(xué)術(shù)社區(qū)相關(guān)研究進(jìn)展和目前存在不足的基礎(chǔ)上,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的智能問答框架,以相關(guān)理論和方法為支撐完善和創(chuàng)新虛擬學(xué)術(shù)社區(qū)知識(shí)服務(wù)的模式,有效發(fā)揮可行性問答框架的泛化作用。對(duì)于模型僅做了實(shí)例研究,并未涵蓋學(xué)術(shù)資源大數(shù)據(jù)做技術(shù)實(shí)驗(yàn),有待后續(xù)進(jìn)一步研究。智能問答的開發(fā)與應(yīng)用在節(jié)省時(shí)間精力的同時(shí)有效滿足科研人員的咨詢需求。在現(xiàn)有虛擬學(xué)術(shù)社區(qū)的基礎(chǔ)上,建設(shè)功能更完善、服務(wù)更個(gè)性化的新型虛擬學(xué)術(shù)社區(qū)。

        猜你喜歡
        智能用戶信息
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會(huì)信息
        国产优质女主播在线观看| 中国熟妇人妻xxxxx| 欧美日韩亚洲精品瑜伽裤| 亚洲成av人无码免费观看| 亚洲av日韩综合一区尤物| 少妇伦子伦情品无吗| 国产成人亚洲精品无码h在线| 揄拍成人国产精品视频肥熟女 | 亚洲中文字幕在线精品2021| av在线观看免费天堂| 人妻无码一区二区视频| 综合网在线视频| 青青草视频在线播放81| 精品亚洲一区二区三区四区五区| 色先锋av资源中文字幕| 97日日碰日日摸日日澡| 人妻1024手机看片你懂的| 欧美伦费免费全部午夜最新| 激情 人妻 制服 丝袜| 亚洲高清国产品国语在线观看| 久久成人精品国产免费网站| 久久久久九九精品影院| 99精品视频在线观看免费| 久久99国产亚洲高清观看首页| 男女射精视频在线观看网站| 国产精品∧v在线观看| 96精品在线| 亚洲一区二区三区亚洲| 国色天香社区视频在线| 日韩人妻无码一区二区三区久久99| 久久精品国产亚洲AV香蕉吃奶| 久久综合另类激情人妖| 人妻aⅴ中文字幕| 免费看奶头视频的网站| av男人天堂网在线观看| 无码gogo大胆啪啪艺术| 亚洲 欧美 综合 另类 中字| 一区二区三区国产偷拍| 国产午夜激无码av毛片不卡| 国产精品狼人久久影院软件介绍| 狠狠色狠狠色综合|