亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        蒙古語自動問答系統(tǒng)建設情況研究

        2022-07-16 10:57:42娜仁高娃
        內蒙古科技與經濟 2022年10期
        關鍵詞:蒙古語自動領域

        娜仁高娃

        (內蒙古自治區(qū)地方語言文字研究應用中心,內蒙古 呼和浩特 010021)

        1 自動問答系統(tǒng)研究綜述

        自動問答(Question Answering,QA)是指利用計算機自動回答用戶所提出的問題,以滿足用戶知識需求的任務。不同于現有搜索引擎,問答系統(tǒng)是信息服務的一種高級形式,系統(tǒng)返回用戶的不再是基于關鍵詞匹配排序的文檔列表,而是精準的、以自然語言形式描述的答案。近年來,隨著人工智能的飛速發(fā)展,自動問答已經成為備受關注且發(fā)展前景廣泛的研究方向。

        自動問答的研究歷史可以溯源到人工智能的原點。1950 年,人工智能之父阿蘭圖靈(Alan M.Turing)在《Mind》上發(fā)表文章“Computing Machinery andIntelligence”,文章開篇提出通過讓機器參與一個模仿游戲(Imitation Game)來驗證“機器”能否“思考”,進而提出了經典的圖靈測試(Turing Test),用以檢驗機器是否具備智能。同樣,在自然語言處理研究領域,問答系統(tǒng)被認為是驗證機器是否具備自然語言理解能力的4個任務之一(其他3個是機器翻譯、復述和文本摘要)。目前在自動問答系統(tǒng)研究領域,相對成熟的問答系統(tǒng)有麻省理工學院人工智能實驗室的 STARTSO 系統(tǒng)、密歇根州立大學的 AnswerBus 系統(tǒng)等。其中,STARTSO 系統(tǒng)基于互聯(lián)網訪問設計,可通過精心構建的知識庫來自動地回答資料庫中一些比較簡單的問題,但卻不能借助互聯(lián)網自行擴充內部的知識含量。而 AnswerBus 系統(tǒng)支持多文種訪問的具有多領域知識的自動問答系統(tǒng),自 2011 年上線以來,已經回答了許多用戶的問題。從應用角度,現有基于關鍵詞匹配和淺層語義分析的信息服務技術已經難以滿足用戶日益增長的精準化和智能化信息需求,已有的信息服務范式急需一場變革。2011 年,華盛頓大學圖靈中心主任 Etzioni 在《Nature》上發(fā)表的“Search Needs a Shake-Up”中明確指出:在萬維網誕生20周年之際,互聯(lián)網搜索正處于從簡單關鍵詞搜索走向深度問答的深刻變革風口浪尖上。以直接而準確的方式回答用戶以自然語言提問的自動問答系統(tǒng)將構成下一代搜索引擎的基本形態(tài)。2011年,以深度問答技術為核心的IBM Watson自動問答機器人在美國智力競賽節(jié)目Jeopardy中戰(zhàn)勝人類選手,引起了業(yè)內的巨大轟動。Watson自動問答系統(tǒng)讓人們看到已有信息服務模式被顛覆的可能性,成了問答系統(tǒng)發(fā)展的一個里程碑。此外,隨著移動互聯(lián)網崛起與發(fā)展,涌現出了很多以蘋果公司 Siri、Google Now、微軟 Cortana 等為代表的移動生活助手。上述幾個系統(tǒng)都把以自然語言為基本輸入方式的問答系統(tǒng)看作是下一代信息服務的新形態(tài)和突破口,并加大人員、資金的投入,試圖在這一次人工智能浪潮中取得領先。

        國內也有不少科研院所正在開展問答系統(tǒng)的研究,比如復旦大學、中科院、哈工大等。其中,哈爾濱工業(yè)大學開發(fā)了基于常用問題集的漢語問答系統(tǒng),該系統(tǒng)首先根據用戶的提問建立一個候選問題集,然后通過計算句子語義相似度,在候選問題集中找到相似的問句,并將答案返回給用戶。而中科院的 NKI 知識問答系統(tǒng)以 NKI 知識庫為基礎,可以向用戶提供多個領域的知識服務,并且向自然語言方式進行提問的用戶返回準確的答案。國內漢語自動問答系統(tǒng)的研究和使用領域發(fā)展均較快,如除了銀行、車站等公共場所外的教育門戶網站、旅游、醫(yī)藥、汽車、銷售服務、購物平臺,等等。不同行業(yè)根據自身業(yè)務和服務特點,設計不同的架構方法和技術手段,實現和開發(fā)可操作性強的自動問答系統(tǒng)。

        但是蒙古語自動問答系統(tǒng)的研究相對落后,使用領域也相對較少。筆者以蒙古文信息化工作發(fā)展情況為切入點,重點了解蒙古語自動問答系統(tǒng)研發(fā)及使用情況,并對其行業(yè)發(fā)展進行了分析,同時提出應加強多語種自動問答系統(tǒng)研發(fā)和推廣的建議。

        2 調查設計

        為摸清我國蒙古語自動問答系統(tǒng)的建設使用現狀,本研究采用問卷調查的方法對蒙古語自動問答系統(tǒng)建設使用情況進行了調查。①確定研究區(qū)域。以內蒙古自治區(qū)為主,輻射至使用蒙古語的其他7個省、自治區(qū),以蒙古文信息化研究為脈絡,對重點企業(yè)、科研院所、政府網站群、各大媒體從業(yè)人員為重點調查對象。②進行數據的收集。采用問卷調查法、訪談法了解各領域使用情況,認真做好訪談記錄。③進行統(tǒng)計分析。本次調查共發(fā)放問卷280份,回收268份,回收率為95.7%;有效問卷251份,有效率為93%。為確保研究結果真實有效,筆者對重點行業(yè)及相關企業(yè)進行了走訪調查,并將了解到的情況逐一進行分析,以便提出有針對性的意見、建議。

        3 調查結果與分析

        本課題從被調查者基本情況(職業(yè)、所屬地區(qū))、蒙古語自動問答系統(tǒng)研發(fā)技術環(huán)境、重視程度、市場認知度、蒙古語自動問答系統(tǒng)使用情況、使用領域、自動問答系統(tǒng)發(fā)展趨勢等6大類共12個問題進行了調查。

        3.1 基本情況

        被調查者來自內蒙古自治區(qū)、遼寧省、黑龍江省、吉林省、河北省、甘肅省省、青海省、新疆維吾爾自治區(qū)等使用蒙古語的地區(qū),其中內蒙古為主要地區(qū),調查總數200份,占總調查問卷的80%。其余51份來自其他省,占總調查問卷的20%。

        內蒙古所轄12個盟市,其中呼和浩特為經濟社會發(fā)展中心,首府城市,共收集到110份調查問卷,占內蒙古總量的55%。其余盟市共90份,占內蒙古總量的45%。所涵蓋的調查樣本能真實反映目前蒙古語自動問答系統(tǒng)建設使用情況。

        調查對象從事的行業(yè)組成為:相關企業(yè)人員 80人,占總人數的32%;媒體從業(yè)人員60人,占總人數的24%;科研院所人員30人,占總數的12%;行政事業(yè)單位工作人員80人,占總數的32%(見圖1)。設計初衷是從這些從事蒙古文信息化企業(yè)及科研院所人員中了解蒙古語自動問答系統(tǒng)開發(fā)、建設基本情況。因此,對開發(fā)者設置了不同于使用者的問卷。

        圖1 調查對象職業(yè)組成

        3.2 自動問答系統(tǒng)建設使用情況

        3.2.1 自動問答系統(tǒng)研發(fā)技術環(huán)境。從企業(yè)及科研院所技術人員使用的開發(fā)環(huán)境、開發(fā)語言、開發(fā)成果考慮,對研發(fā)自動問答系統(tǒng)所使用的技術環(huán)境設計了以下兩個問題,進行了調研。

        “您開發(fā)成果主要發(fā)布平臺是?”(企業(yè)及相關開發(fā)人員作答)

        調查數據顯示,PC端中88.3%的人使用Windows系統(tǒng);9%的人使用Linux系統(tǒng);2.7%的人使用MacOS系統(tǒng);移動端中53.3%人使用 Android系統(tǒng);46.7%的人使用 iOS系統(tǒng)。

        “您用的主要開發(fā)語言是?”(企業(yè)及相關開發(fā)人員作答)

        調查數據顯示使用C/C++的占25.8%;使用.NET的19.4%;使用JavaScript/TypeScript 的占16.1%;使用JAVA 的12.9%;也有使用PHP、Ruby、Swift、Python等開發(fā)語言的,使用人數基本都在10%以下(見表1)。

        表1 研發(fā)技術環(huán)境統(tǒng)計

        從以上問卷調查可以分析出,開發(fā)自動問答系統(tǒng)所用系統(tǒng)是以Windows系統(tǒng)為主,開發(fā)語言以C/C++和.NET為主,這也基本符合當前不同平臺在技術研發(fā)環(huán)境中的使用情況。另外,考慮到當前自動問答系統(tǒng)在工作場景中的使用率并不高,本次問卷調查也基本映射了未來自動問答系統(tǒng)的主要使用環(huán)境。

        3.2.2 自動問答系統(tǒng)的重視程度。從參與開發(fā)情況、研發(fā)產品面向領域和企業(yè)重視程度(企業(yè)及相關開發(fā)人員作答)等方面進行了調研。

        “您有無從事過蒙古語自動問答系統(tǒng)開發(fā)工作?”(企業(yè)及相關開發(fā)人員作答)

        調查數據顯示,7.7%的人參與過自動問答系統(tǒng)的開發(fā)工作;92.3%的人沒有參與過蒙古語自動問答系統(tǒng)開發(fā)工作。

        “您所開發(fā)產品主要面向的領域是?”(企業(yè)及相關開發(fā)人員作答)

        調查數據顯示45.3%的人所研發(fā)產品面向媒體領域;21.3%的產品面向文化領域;12%的產品面向教育領域;醫(yī)療和旅游領域分別占6.7%;交通領域占5.3%,政務公開領域占2.7%。

        “您認為當前迫切需要開發(fā)推廣哪些領域的蒙古語言文字信息化軟件、系統(tǒng)”(多選)。

        調查數據顯示,人們迫切需要的軟件、系統(tǒng)主要集中在以下幾個領域,其中23.8%的人選擇了教育領域;22.1%的人選擇了政務服務領域;19.4%的人選擇了醫(yī)療衛(wèi)生領域;17.7%的人選擇了影視娛樂;15.2%的人選擇了電子商務;1.8%的人選擇了其他領域(見圖2)。

        圖2 開發(fā)產品主要面向的領域

        從以上調查問卷分析出,企業(yè)及科研院所在蒙古語自動問答系統(tǒng)研發(fā)上的投入較少,相關人才相對缺乏。而這些開發(fā)人員研發(fā)產品主要面向的領域集中在文化領域等接受性強的領域,而在政務服務及醫(yī)療、電商行業(yè)等服務性強且需要人員互動行業(yè)的研發(fā)相對落后。最后一個問題則說明當前迫切需要與自動問答密切相關的各類服務行業(yè)軟件,如教育、政務服務、醫(yī)療衛(wèi)生、電子商務等等。

        3.2.3 自動問答系統(tǒng)市場認知度。人們對自動問答系統(tǒng)的認知度如何?通過設計以下兩個問題,進行了調研。

        “您對自動問答系統(tǒng)了解嗎?”

        調查數據顯示了解的占33.3%;不了解的占63.7%。

        “您所用過的蒙古語言文字信息化成果有哪些?”(多選)。

        調查數據顯示,被調查者用過的所有成果中位居榜首的是字體/輸入法,占比為17.8%;機器翻譯次之,占比為17.2%;15.1%的人使用辦公軟件;10.4%的人使用編碼轉換系統(tǒng);9.1%的人使用各種小程序;8.7%的人使用文本校對系統(tǒng);5.7%的人使用文字識別系統(tǒng);5.3%的人使用各類資源庫;4.3%的人使用語音識別系統(tǒng);3.0%的人使用手寫識別系統(tǒng);2.1%的人使用語音合成系統(tǒng);0.9%的人使用自動問答系統(tǒng);1.5%地選了其他。

        從數據分析很容易得出大部分人不太了解自動問答系統(tǒng)的結論。這也間接反映出蒙古語言文字信息化發(fā)展水平,涉及自然語言處理技術的語音識別、語音合成、自動問答等相關領域的研究和應用相對滯后,字體/輸入法、機器翻譯、辦公軟件、編碼轉換系統(tǒng)等領域應用較活躍(見圖3)。

        圖3 蒙古語言文字信息化成果市場認知度

        3.2.4 自動問答系統(tǒng)具體領域使用情況。在公共服務領域和政務服務領域制定兩個問題,對蒙古語自動問答系統(tǒng)使用情況進行了調查?!澳佑|到哪些公共服務領域的蒙古語自動問答系統(tǒng)?”(多選)調查數據顯示,在公共服務領域中使用蒙古語自動問答系統(tǒng)百分比分別為:銀行自動問答系統(tǒng)占33.6%;通信領域占23.0%;車站、機場等交通領域占18.0%;醫(yī)療領域占10.1%;圖書館占8.8%;購物平臺占2.3%;賓館住宿1.8%;旅游領域占1.8%;其他領域占0.5%(見圖4)。

        圖4 蒙古語自動問答系統(tǒng)公共服務領域使用情況

        “您接觸到哪些政務服務領域的蒙古語自動問答系統(tǒng)?”(多選)調查數據顯示,在政務服務領域使用蒙古語自動問答系統(tǒng)百分比分別為:行政服務中心占31.9%;教育領域占15.0%;社會保障領域占13.3%;民政占9.7%;交通領域占9.7%;信訪占6.2%;工商占4.4%;稅務占3.5%;醫(yī)保占3.5%;城管占0.9%;其他領域占1.8%(見圖5)。

        圖5 蒙古語自動問答系統(tǒng)在政務服務領域使用情況

        分析得出,在公共服務方面,蒙古語自動問答系統(tǒng)在銀行和通信領域使用較為普遍;在政務服務領域中行政服務中心使用率最高,在教育、社保、民政等領域普及率不高。

        3.3 自動問答系統(tǒng)發(fā)展趨勢

        在未來自動問答系統(tǒng)需求方面,設計了一個被調查者主觀列舉的問卷項目,被調查者根據自身需求羅列具體領域,從而了解自動問答系統(tǒng)將來的需求情況。

        “您希望在日常生活中用到哪些領域的蒙古語自動問答系統(tǒng)?請具體列舉:”調查數據顯示,集中在以下6種情況:①出入口。學校、醫(yī)院、銀行、商場、超市、車站、機場、行政部門等各單位出入口使用自動問答系統(tǒng)方便出行者。②政務服務領域。民政、司法、社會保障、交通、城管、稅務、工商、信訪、行政服務中心、旅游等政務服務上使用自動問答系統(tǒng)。③公共服務領域。教育領域、醫(yī)療領域、交通運輸領域、金融領域、稅務、社會保障、通信領域、圖書館、銀行等公共服務領域使用自動問答系統(tǒng)。④應用軟件平臺。電子商務、日常繳費、通信設備、翻譯、購物平臺、地圖導航、手機應用等軟件平臺使用自動問答系統(tǒng)。⑤12345、12333、12123、12315等智慧服務平臺使用自動問答系統(tǒng)。⑥面向老人的特定場所,或者關愛老人的特殊服務,老人多咨詢的地方設置自動問答系統(tǒng)。

        分析得出,隨著信息技術的發(fā)展人們對自動問答系統(tǒng)的使用領域也越來越廣,需求也更加多樣化。從孩子上學到老人的日常服務,從衣食住行到生老病死無一例外,都用自動問答系統(tǒng)來實現便利。在今后的發(fā)展中,蒙古語自動問答系統(tǒng)應更多參考較為成熟的漢語自動問答系統(tǒng)各領域的成功案例,更好地服務與當地少數民族群眾。同時加強研發(fā)推廣多語種自動問答系統(tǒng),對使用推廣普及國家通用語言文字、提升國際影響力等方面具有獨特的作用。

        4 存在的問題

        4.1 自然語言處理技術還處于起步階段

        自然語言處理技術是自動問答系統(tǒng)的核心技術。蒙古語自動問答技術的研究還處于起步階段。其智能化、語音接口的性能優(yōu)化設計研究等方面發(fā)展緩慢?,F自治區(qū)各公共服務領域只有銀行等少數服務行業(yè)設置了蒙古語自動問答系統(tǒng),但仍未能在機場、車站、醫(yī)院等更多公共服務領域全面普及。蒙古語自動問答系統(tǒng)研發(fā)力度不夠,技術落后,應用面較窄等制約著蒙古語自動問答系統(tǒng)的開發(fā)、普及和使用率。

        4.2 沒有大規(guī)模規(guī)范的語料

        在互聯(lián)網大數據時代下數據信息量不斷增加,數據之間的關聯(lián)度越來越復雜。蒙古語口語化的語料較少、不平衡,語料庫的質量、數據表達不規(guī)范等都會影響問答系統(tǒng)的質量。

        4.3 企業(yè)研發(fā)重視程度不夠,應用受限

        由于蒙古語使用群體為少數群體,研發(fā)產品經濟利益不可觀,因此中小企業(yè)將大部分人力、物力投放于經濟效益好的產業(yè)上,只投入小部分精力投入蒙古語自動問答系統(tǒng)開發(fā)?;蛘吣承┢髽I(yè)緊靠研發(fā)人員興趣愛好,自己擠出時間和精力進行研究。

        5 發(fā)展自動問答系統(tǒng)的對策和建議

        5.1 統(tǒng)一規(guī)范、不斷增加語料規(guī)模,為研究開發(fā)奠定基礎

        近年來在黨和國家的指導下,在建設統(tǒng)一、規(guī)范的語料方面已經取得了一定的成績,自治區(qū)民委承擔建設國家發(fā)展和改革委員會批復項目“蒙古語言文字數字資源建設與共享工程”,通過該項目的建設研制了資源建設及信息處理相關26項標準,同時建立了涵蓋文化、科技、教育、基礎等方面內容的大規(guī)模的資源。在已經取得成績上后續(xù)增加投入,把資源建設好,為蒙古語自然語言處理技術研發(fā)奠定基礎。

        5.2 加大人才培養(yǎng),面向高校、科研院所及相關單位技術人員,多給予自然語言處理技術方面的課題支持

        通過不斷研究將這項技術瓶頸攻破,漢語和蒙古語,屬于不同語系研究范疇,漢語自然語言處理技術已經取得了較好的成績,但是蒙古語自然語言處理還不能直接引用相關技術,需要該語言的攻克研究。

        5.3 加大資金投入,鼓勵和支持中小企業(yè)參與自動問答系統(tǒng)開發(fā)應用

        通過電子信息產品制造和市場開拓、信息服務企業(yè)培育等企業(yè)稅金或產品、創(chuàng)新技術研發(fā)費用加計扣除等財稅優(yōu)惠保障,不斷提高相關企業(yè)的技術研究積極性,激勵蒙古語言文字信息化技術研發(fā)和推廣應用。

        5.4 提高用戶體驗,提升認知度,讓用戶真正感受到科技帶來的方便

        在公共服務領域方面應加強銀行、醫(yī)療、通信、車站、機場、購物平臺及旅游等方面具體服務的創(chuàng)新性、方便性、科技引領性,讓用戶切身感受到科技帶來的巨大優(yōu)惠。在政務服務方面,不斷擴展具體服務領域的同時,將已有的服務不斷優(yōu)化升級,讓百姓在行政服務中心辦事少跑腿、少走彎路,出行方便,人身財產得到安全保障,隨時提供完備的醫(yī)保、社保、稅務、司法、金融,等等咨詢服務。

        5.5 發(fā)揮好在智能平臺及智慧城市建設中的作用

        知識社會環(huán)境下的智慧城市是繼數字城市之后信息化城市發(fā)展的高級形態(tài)。智慧城市的驅動力來自以物聯(lián)網、云計算、移動互聯(lián)網為代表的新一代信息技術。自然語言處理、自動問答系統(tǒng)咨詢服務顯然成為智慧城市中的一個標志。運用自動問答系統(tǒng)研發(fā)成果在12345、12333、12123、12315等各類智慧服務平臺上,不僅精準高效,而且能快速解答咨詢者,還能節(jié)省很多人力。

        6 結束語

        蒙古語是跨境語言,對蒙古語自動問答系統(tǒng)建設使用情況的研究不僅對中、蒙、俄三國有著深遠的意義,同時對自動問答、蒙古文自然語言處理等領域有著深遠的意義。跨境語言研發(fā)成果不僅提升國家科技領先地位,還能最大限度保障國家網絡信息安全,為筑牢祖國北疆安全屏障提供信息技術支撐。

        猜你喜歡
        蒙古語自動領域
        含有“心”一詞蒙古語復合詞的語義
        自動捕盜機
        學生天地(2020年5期)2020-08-25 09:09:08
        土默特地方蒙古語地名再探
        領域·對峙
        青年生活(2019年23期)2019-09-10 12:55:43
        基于STM32的自動喂養(yǎng)機控制系統(tǒng)
        電子測試(2018年10期)2018-06-26 05:53:36
        論蒙古語中反映心理逆境傾向的某些字的含義
        俄語詞“Sherti”在蒙古語中的變義(蒙古文)
        關于自動駕駛
        汽車博覽(2016年9期)2016-10-18 13:05:41
        Stefan Greiner:我們?yōu)槭裁葱枰詣玉{駛?
        新常態(tài)下推動多層次多領域依法治理初探
        国产成人av区一区二区三| 久久精品岛国av一区二区无码 | 亚洲高清有码在线观看| 全程国语对白资源在线观看| 国产情侣自拍一区视频| 国产午夜福利片| 亚洲国产一区二区三区网| 中文字幕亚洲日本va| 亚洲悠悠色综合中文字幕 | 国产无套护士在线观看| 91精品国产91久久久无码色戒| 伊人狼人大香线蕉手机视频| 精品亚洲成a人在线观看| 99久久久无码国产精品试看| 国产精品国产三级国产av创| 亚洲一区二区懂色av| 国产麻豆剧果冻传媒一区| 色妞色综合久久夜夜| 久久久久亚洲AV无码专区一区| 亚洲精品中文字幕一二三四| 在线观看视频播放| 久久免费网国产AⅤ| 中文乱码字幕在线中文乱码 | 亚洲男人在线无码视频| 精彩视频在线观看一区二区三区 | 日韩中文字幕在线观看一区 | 成人免费播放视频777777| 国产人妻久久精品二区三区| 97av在线播放| 久久本道久久综合伊人| 人妻 色综合网站| 91亚洲国产成人aⅴ毛片大全 | 18禁真人抽搐一进一出在线| 亚洲免费天堂| 日产一区一区三区区别| 国产精品无码人妻在线| 国产香蕉一区二区三区在线视频| 日本女优在线观看一区二区三区| 国产av精品一区二区三区久久| 俺去俺来也在线www色官网| 日本口爆吞精在线视频|