亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向高校的智能問答系統(tǒng)設計

        2022-02-22 01:07:20戚夢瑤
        電腦知識與技術 2022年36期
        關鍵詞:文本分類數(shù)字化校園

        戚夢瑤

        關鍵詞:問答系統(tǒng);校園問答;數(shù)字化校園;文本分類;文本相似度

        中圖分類號:TP391.1 文獻標識碼:A

        文章編號:1009-3044(2022)36-0033-03

        1 概述

        智能問答系統(tǒng)是一種能夠理解用戶提出的用自然語言表述的問題,并能夠自動、準確地給出用戶答案的軟件系統(tǒng)[1]?,F(xiàn)今互聯(lián)網(wǎng)上的資源信息飛速增長,如何精確、快速地從海量信息中挖掘用戶想要的信息成為亟待解決的問題。智能問答系統(tǒng)是進行該項工作的重要手段,很大程度上可以替代或輔助傳統(tǒng)人工咨詢的方式。

        根據(jù)應用領域的不同,智能問答系統(tǒng)一般可分為面向開放域的問答系統(tǒng)和面向限定域的問答系統(tǒng)[2]。面向開放域的問答系統(tǒng)包含豐富的知識庫,為回答多個領域的問題提供了一定的基礎,但在回答專業(yè)領域的問題時難以精準定位答案、表現(xiàn)較差[3]。目前針對法律[4]、醫(yī)療[5]、金融[6]等限定領域的智能問答系統(tǒng)研究較為成熟,而針對高校領域的問答系統(tǒng)研究仍處于起步階段。為了能夠整合多方面資源,為高校學生提供快速、高效、準確的校園智能問答服務,同時建立起統(tǒng)一的信息獲取平臺,完善數(shù)字化校園建設,并進一步實現(xiàn)學生在校情況動態(tài)監(jiān)測,本文旨在運用人工智能、自然語言處理等相關技術,研究和設計面向高校的智能問答系統(tǒng)。

        2 高校應用智能問答系統(tǒng)的意義

        高校是一個復雜的社會化服務系統(tǒng),應向學生提供各類服務,如教育服務、生活服務等。學生在接受服務的過程中可能會遇到問題,需要進行咨詢得到解答,例如食堂供應時間、圖書館開放時間、請假審批流程等;在招生季,學生會咨詢大量有關報考方面的問題,例如招生計劃、專業(yè)選擇、學校制度等。學生在遇到問題時會咨詢班主任、輔導員或者學校行政人員,但事實上,學生提出的大多數(shù)問題具有相似性,同時教師和行政人員難以對每個學生提出的問題都做出非常及時和詳細的解答,而智能問答系統(tǒng)的研究和開發(fā)可以在以上校園問答場景中發(fā)揮重要作用,具體有以下三點意義:

        1)建立統(tǒng)一信息獲取平臺、提高校園咨詢效率。通過分析高校這一限定領域的特點,以校園為導向幫助院校建立起統(tǒng)一、可靠的信息獲取平臺,自動解答學生用自然語言提出的問題,為學校提供良好的信息化服務途徑。相比傳統(tǒng)的人工問答方式,使用智能問答系統(tǒng)可以為高校降低人力成本,解決大量重復、可自動化的工作內(nèi)容,并能夠24小時為學生提供高效、標準化的校園咨詢服務。

        2)完善數(shù)字化校園建設。數(shù)字化校園建設已成為教育信息化的重要部分,也是衡量教育現(xiàn)代化發(fā)展的主要標志?;谌斯ぶ悄芗夹g開發(fā)的智能問答系統(tǒng)輔助傳統(tǒng)的人工咨詢流程,可以提升高校管理效能和服務水平,實現(xiàn)校園服務工作信息化、自動化、便捷化,持續(xù)推動數(shù)字校園的建設和發(fā)展[7]。

        3)實現(xiàn)學生在校情況動態(tài)監(jiān)測。學生在平臺咨詢的問題能夠體現(xiàn)學生在校期間的各方面情況,在智能問答系統(tǒng)的運行推廣過程中,可以不斷收集和整合學生咨詢的問題,并基于問題數(shù)據(jù)做進一步的統(tǒng)計與分析,統(tǒng)計分析的結果可供高校有關部門進行參考,使得對學生在校生活、學習情況有大致的了解,真正落實“以學生為中心”的理念。

        3 智能問答系統(tǒng)框架

        本文設計的面向高校的智能問答系統(tǒng)框架如圖1所示,分為數(shù)據(jù)、算法、應用三個部分。用戶通過前端界面輸入用自然語言表述的問題,首先系統(tǒng)會對問題進行分詞、去除停用詞等預處理操作,并使用詞向量模型表示文本,接著通過問題分類模塊以及文本相似度計算模塊,向用戶返回結果。在上述過程中,若無法成功在系統(tǒng)中匹配到用戶的問題,則管理員需要及時在校園問答庫中進行補充,從而使得問答庫能夠不斷更新和完善。

        數(shù)據(jù):包括構建校園問答庫以及數(shù)據(jù)預處理。構建校園問答庫是智能問答庫的基礎,通過網(wǎng)絡爬取數(shù)據(jù)以及問卷收集數(shù)據(jù)兩種方式構建問答對。為了后續(xù)算法的實現(xiàn),還需進行數(shù)據(jù)預處理步驟,構建詞向量表示文本。

        算法:包括問題分類模塊以及文本相似度計算模塊。問題分類模塊使用訓練得到的分類器對已經(jīng)預處理的用戶問題進行分類,得到問題所屬的類別。文本相似度計算模塊將用戶問題和問答庫中的問題進行文本相似度計算,獲取用戶需要的答案。

        應用:向用戶提供方便操作的可視化前端界面,用戶可通過前端界面發(fā)送問題并接收結果。為方便用戶的使用,接入微信公眾號,可采取基于MVC(Mod?el View Controller模型-視圖-控制器)設計模式,采用Vue.js框架實現(xiàn)微信客戶端的開發(fā)。

        4 構建校園問答庫(FAQ)

        構建校園問答庫是實現(xiàn)自動問答系統(tǒng)的基礎,其優(yōu)劣對于智能問答系統(tǒng)的適用性以及可靠性起著至關重要的作用。校園問答庫中的問題要能夠基本覆蓋高校學生會遇到的常見問題,答案需要根據(jù)不同高校的實際情況對問題進行有針對性地解答。本文收集問題數(shù)據(jù)的方式有兩種,一種是使用爬蟲技術,爬取各高等院校貼吧中的問題數(shù)據(jù);另外一種是通過問卷調(diào)查的方式,收集學生在平常學習、生活過程中容易碰到的問題。

        在收集完問題之后,需要給問題標注準確的答案,形成問答對。同時為實現(xiàn)后續(xù)自動問答模塊的問題分類功能,還需手工給問題標注分類標簽,本文針對校園場景將問題分為3種類別,最終得到的校園問答庫示例數(shù)據(jù)如表1所示。

        5 自動問答模塊設計

        5.1 自動問答模塊處理流程

        自動問答模塊是本系統(tǒng)的核心,其處理流程如圖2所示。首先對用戶提出的問題進行分類,若問題屬于某個類別的可能性最大且超過閾值,則將問題標記為該類別,否則提示用戶該問題類型不在問答庫中,同時系統(tǒng)記錄該問題并通知管理員是否考慮添加新問題類別。在得到問題所屬類別后,將其與校園問答庫(FAQ)中同類別下的問題進行相似度計算,找到問答庫中與用戶提出的問題相似度最高的問題,并判斷相似度是否超過閾值,若超過閾值則將對應的答案返回給用戶,否則提示用戶該問題不在問答庫中,同時系統(tǒng)記錄該問題并通知管理員在問答庫中添加該問題以及對應的答案。

        5.2 自動問答模塊實現(xiàn)流程

        自動問答模塊通過獲取詞向量、問題分類、問句相似度計算三個步驟,基于Word2vec詞向量模型和TextCNN模型實現(xiàn)自動問答模塊關鍵算法。

        5.2.1 文本向量表示

        首先,需要將用自然語言表述的問題轉換為計算機可以識別的格式,使用Word2vec模型進行文本向量表示。在構建詞向量前,需要對校園問答庫(FAQ)中問題進行數(shù)據(jù)預處理,主要包括對問句的分詞處理、去除停用詞、特征詞提取等操作。

        1)分詞處理:詞是漢語中最基本的語義單位,分詞主要是將原先沒有分割符的中文語句(例如“我想咨詢食堂開放時間”)按照規(guī)定的劃分原則拆分其中的字或詞(“我/想/咨詢/食堂/開放/時間”)的過程。

        2)去除停用詞:為提升文本特征的質(zhì)量,降低文本特征的維度,進行去除停用詞操作。“停用詞”為經(jīng)常出現(xiàn)在文本中但對信息檢索沒有幫助的、應該提前消除的詞語,例如中文語句中的語氣詞、助詞、虛詞等,目前常見的去除停用詞的方法是通過構建停用詞表,主流的通用中文停用詞表有百度停用詞表、哈工大停用詞表等。

        3)特征詞提?。禾卣髟~是指能表示文本意向的關鍵詞,能否正確地找出問題中的特征詞,影響著后續(xù)文本分類及相似度計算的準確性和效率[8]。

        接著基于Word2vec模型對知識庫中的問題數(shù)據(jù)構建詞向量集。Word2vec有兩種詞向量訓練模式,包括CBOW和Skip-gram[9]。對于用戶輸入的問題,也需要利用Word2vec模型獲取其詞向量,從而方便進行下一步的問題分類和相似度計算。

        5.2.2 問題分類

        對用戶輸入的問題進行分類,從而縮小問題集比對范圍,提高問答的準確性。文本分類過程包括兩個步驟:模型訓練和測試。在得到詞向量后,基于Ten?sorflow機器學習框架構建Text-CNN[10]模型,該模型首先通過卷積層、池化層提取特征,其流程框架如圖3所示,然后對提取到的特征進行分析就可以實現(xiàn)文本分類。

        利用訓練數(shù)據(jù)集訓練分類模型,在模型訓練過程中,性能評價指標可以使用損失(loss)和準確率(Ac?curacy)。然后,對訓練好的分類模型進行測試,在模型測試過程中,性能評價指標可以使用損失(loss)、準確率(Accuracy)、查準率(precision)、召回率(recall)、F1 Score以及混淆矩陣。如果訓練結果不理想,調(diào)整參數(shù)進行訓練,再次對模型進行測試,直到找到最優(yōu)的文本分類模型。

        5.2.3 計算相似度

        最后,計算用戶提出的問題與校園問答庫(FAQ)中的問題集的相似度,根據(jù)相似度逆序排序得到答案,并將答案返回用戶可視化前端界面。采用Word2vec結合余弦相似度公式計算問句詞向量間的距離。對于每個文本組合(q,a),其中q 為用戶提出的問題,a 為問題庫中的候選問題,詞向量余弦相似度計算公式如式(1)所示。

        6 結束語

        本文設計了一個適用于高校的智能問答系統(tǒng),并基于Word2vec詞向量模型、TextCNN模型設計自動問答算法,能基本實現(xiàn)校園場景下的自動問答應用,為學生提供更高效的問答服務,為高校有關部門提升工作效率提供參考。但系統(tǒng)仍有不完善之處需要在未來進行進一步優(yōu)化,主要有以下兩個方面。

        1)添加用戶評價及反饋功能。在用戶通過智能問答系統(tǒng)提問并得到答案之后,邀請用戶對答案的滿意度進行評分,從而能夠在問答庫構建以及算法模型訓練過程不斷改進,形成良性循環(huán),使得系統(tǒng)能夠更符合用戶的使用需求。

        2)與可視化大屏系統(tǒng)相結合。在問答系統(tǒng)的運行過程中可以積累大量的問答數(shù)據(jù),結合大數(shù)據(jù)技術分析問答數(shù)據(jù),開發(fā)可視化大屏,使用圖表的形式進行統(tǒng)計展示,與問答系統(tǒng)相結合,開放接口,構建全方面、閉環(huán)、可拓展的智能校園問答體系,推動校園數(shù)字化建設。

        猜你喜歡
        文本分類數(shù)字化校園
        基于組合分類算法的源代碼注釋質(zhì)量評估方法
        基于貝葉斯分類器的中文文本分類
        數(shù)字化校園中統(tǒng)一移動平臺的實踐與探索
        如何加強校園信息化建設創(chuàng)學校發(fā)展提速平臺
        淺析高校一卡通系統(tǒng)財務管理
        時代金融(2016年27期)2016-11-25 17:57:41
        基于大數(shù)據(jù)的數(shù)字化校園中學生學籍管理系統(tǒng)
        基于蟻群智能算法的研究文本分類
        數(shù)字化校園的整體構架及技術分析
        基于樸素貝葉斯分類的Java課程網(wǎng)絡答疑反饋系統(tǒng)
        基于K—means算法的文本分類技術研究
        99热国产在线| 亚洲成aⅴ人片久青草影院| 精品国模一区二区三区| 久久久久中文字幕精品无码免费 | 国产午夜激无码av毛片不卡| 免费无遮挡禁18污污网站| 日韩中文字幕中文有码| 久久综合激激的五月天| 美女主播福利一区二区| 国产男女猛烈无遮挡免费网站| 午夜一级韩国欧美日本国产| 中文字幕一区二区三区.| 夜晚黄色福利国产精品| 亚洲中文字幕无码一久久区| 国产AV无码专区久久精品网站| 中文熟女av一区二区| 中文字幕一区在线直播| 精品少妇一区二区三区免费观| 久草视频福利| 日韩精品极品在线观看视频| 男女射黄视频网站在线免费观看| 国产av永久无码天堂影院| 国产香蕉尹人综合在线观| av天堂一区二区三区精品| 亚洲乱码中文在线观看| 国产精品18久久久久久麻辣| 91国在线啪精品一区| 精品国产免费一区二区久久| 亚洲av无码国产综合专区| 日本强好片久久久久久aaa| 日韩精品视频免费福利在线观看| 国产一区二区三区在线蜜桃| 亚洲国产另类精品| 国产亚洲欧洲AⅤ综合一区| 国产色第一区不卡高清| 亚洲欧美日韩精品久久| 国产福利午夜波多野结衣| 少妇勾引视频网站在线观看| 亚洲日韩成人无码| 国产香蕉97碰碰视频va碰碰看| 精品人妻免费看一区二区三区|