亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智能信息處理技術(shù)的應(yīng)用與研究

        2014-12-23 00:06:39張成琦湖南涉外經(jīng)濟(jì)學(xué)院長(zhǎng)沙410205
        山東工業(yè)技術(shù) 2014年13期
        關(guān)鍵詞:自然語(yǔ)言處理

        張成琦(湖南涉外經(jīng)濟(jì)學(xué)院,長(zhǎng)沙 410205)

        智能信息處理技術(shù)的應(yīng)用與研究

        張成琦(湖南涉外經(jīng)濟(jì)學(xué)院,長(zhǎng)沙410205)

        摘要:智能信息處理主要涉及智能搜索和信息處理等方面的功能,應(yīng)用的主要技術(shù)是自然語(yǔ)言處理和理解。本文發(fā)現(xiàn)、總結(jié)了智能搜索和信息獲取在自然語(yǔ)言理解應(yīng)用中相關(guān)的問(wèn)題,闡述了問(wèn)題存在的根源以及解決辦法。

        關(guān)鍵詞:智能搜索;信息獲??;自然語(yǔ)言處理;自然語(yǔ)言理解

        隨著信息化技術(shù)的不斷發(fā)展與深入,特別是網(wǎng)絡(luò)技術(shù)的逐漸普及,人們對(duì)信息的需求也是越來(lái)越多,質(zhì)量要求越來(lái)越高,這些所涉及到的都是當(dāng)前計(jì)算機(jī)智能信息處理技術(shù)方面急需解決的難題,鑒于智能搜索和信息獲取理論成熟性、深度,也鑒于它們?cè)谧匀徽Z(yǔ)言理解實(shí)驗(yàn)中取得了較好的效果,重點(diǎn)討論下智能搜索、信息獲取。

        1 兩種思想策略

        自然語(yǔ)言理解技術(shù)就是研究讓計(jì)算機(jī)理解人們?nèi)粘K玫恼Z(yǔ)言,通過(guò)研究希望建立一種人和計(jì)算機(jī)之間友好的交互關(guān)系,關(guān)系建立主要有2種思路,一是實(shí)驗(yàn)?zāi)P退悸?,一種是直接應(yīng)用模型思路。實(shí)驗(yàn)?zāi)P退悸?,是面向人工智能所期望解決的一般語(yǔ)言理解問(wèn)題,主要是研究讓計(jì)算機(jī)理解人的一般語(yǔ)言能力,能在計(jì)算機(jī)上建立一套計(jì)算機(jī)能夠識(shí)別的語(yǔ)言庫(kù)。按照這個(gè)思路,最終可能建成言語(yǔ)分析或生成所需的自然語(yǔ)言理解知識(shí)庫(kù)。而直接應(yīng)用模型策略是直接以應(yīng)用為目標(biāo),無(wú)論哪種情況,都是專(zhuān)門(mén)針對(duì)某一具體領(lǐng)域采用解決自然語(yǔ)言理解的基本策略。

        2 智能搜索

        搜索其實(shí)采用的就是過(guò)濾器模型,通過(guò)標(biāo)注和匹配兩項(xiàng)工作,從原始數(shù)據(jù)中篩選出滿足要求的數(shù)據(jù)。搜索有很多的類(lèi)型,智能搜索是搜索中最高級(jí)的搜索類(lèi)型,是基于語(yǔ)義搜索,搜索對(duì)象小到一句話,大到一段文字。不過(guò)它的主要對(duì)象是自然語(yǔ)言文本,智能搜索是自然語(yǔ)言處理的重要環(huán)節(jié),它在使用過(guò)程的相關(guān)問(wèn)題也就成為大家討論的焦點(diǎn)。

        (1)標(biāo)注。搜索對(duì)象是標(biāo)注的結(jié)果,而標(biāo)注就是產(chǎn)生對(duì)文本的描述,標(biāo)注的關(guān)鍵要素就是標(biāo)注用詞,而通常包含主題詞與自由詞兩種類(lèi)型。使用主題詞存在的問(wèn)題比較多,具體表現(xiàn)在詞表不夠用,內(nèi)容陳舊,而且涉及內(nèi)容過(guò)于復(fù)雜。鑒于此原因,使用自由詞標(biāo)注彌補(bǔ)了使用主題詞的缺陷,同時(shí)不需要理解全文,效率較高;(2)理解搜索要求。用戶(hù)提出的查詢(xún)數(shù)據(jù)的要求通常用都是很零散的,用戶(hù)提出的數(shù)據(jù)查詢(xún)要求,輸入系統(tǒng)、經(jīng)由自然語(yǔ)言理解前端句法語(yǔ)義分析器進(jìn)行分析生成句法樹(shù),然后,系統(tǒng)通常以名詞短語(yǔ)作為搜索的關(guān)鍵詞在經(jīng)過(guò)標(biāo)注的文獻(xiàn)庫(kù)中搜索目標(biāo)對(duì)象;(3)實(shí)現(xiàn)智能搜索。智能搜索的大致過(guò)程是這樣的,對(duì)兩個(gè)或多個(gè)不同的文檔進(jìn)行標(biāo)注,如果標(biāo)注的結(jié)果完全一致,那么說(shuō)明被標(biāo)注結(jié)果相應(yīng)的內(nèi)容也是一致,那所標(biāo)注的內(nèi)容也就是用戶(hù)所查找的目標(biāo)對(duì)象,最終實(shí)現(xiàn)了智能搜索的目的。

        3 信息獲取技術(shù)

        信息獲取相對(duì)于信息搜索來(lái)說(shuō),技術(shù)更先進(jìn),更成熟,它是一門(mén)綜合性極強(qiáng)的技術(shù),同時(shí)以深入的語(yǔ)言處理基本理論和技術(shù)作為支撐,研究多種基本的自然語(yǔ)言處理技術(shù)的綜合應(yīng)用,具有很好的研究?jī)r(jià)值。下面就信息獲取的基本內(nèi)涵、語(yǔ)言處理技術(shù)以及信息獲取的基本過(guò)程等方面內(nèi)容進(jìn)行一些基本的討論。

        (1)信息獲取的內(nèi)涵。信息獲取是指從一段文本中抽取指定的一類(lèi)信息,并將其形成結(jié)構(gòu)化的數(shù)據(jù),然后填入一個(gè)數(shù)據(jù)庫(kù)中供用戶(hù)查詢(xún)使用的過(guò)程。獲取的過(guò)程包含三個(gè)方面的內(nèi)容:一是模板元素,主要涉及文章中的專(zhuān)有名詞、時(shí)間詞、數(shù)量詞和詞組等;二是模板關(guān)系,主要涉及命名實(shí)體之間的各種關(guān)系;三是腳本模板,主要涉及事件之中的各個(gè)實(shí)體、屬性或關(guān)系;(2)語(yǔ)言處理技術(shù)。中文信息的處理包含三個(gè)種自然語(yǔ)言處理的技術(shù):一是詞切分和詞性標(biāo)注。主要技術(shù)是建立信息獲取的詞切分方法,開(kāi)發(fā)合適的漢語(yǔ)詞切分和詞類(lèi)標(biāo)注軟件。二是短語(yǔ)句法及語(yǔ)義分析,主要涉及句法成分的識(shí)別與標(biāo)注,關(guān)鍵詞提取,搜索特征集的提取、索引等。三是句群分析,主要涉及句間成分的傳遞、指代、引用信息表的建立和使用,以及概念關(guān)系的推理等;(3)信息獲取的過(guò)程。信息獲取過(guò)程有4個(gè)環(huán)節(jié),一是描述信息,就是指利用信息模式描述大家感興趣的信息,比如<公司名><產(chǎn)品名>。這樣在系統(tǒng)中預(yù)定義類(lèi)似的信息模式,存放在模式庫(kù)中,供用戶(hù)選用。二是詞法、句法及語(yǔ)義分析,并做各種文本標(biāo)注。借助合適的詞典、構(gòu)詞規(guī)則等知識(shí)庫(kù)的支持,比如名詞短語(yǔ)有人的名字、機(jī)構(gòu)的名稱(chēng)以及產(chǎn)品名稱(chēng)等,再比如動(dòng)詞短語(yǔ)有事件描述與事實(shí)陳述等。三是確定信息的最終形式,主要通過(guò)上下文文關(guān)聯(lián)、指代、引用等分析和推理方式實(shí)現(xiàn)。四是結(jié)果輸出,比如生成一個(gè)關(guān)系數(shù)據(jù)庫(kù)或給出自然語(yǔ)句陳述等。

        參考文獻(xiàn):

        [1]傅承德.自然語(yǔ)言理解的方法與策略[M].河南人民出版社,2001:185.

        [2]陳力為.計(jì)算機(jī)語(yǔ)言學(xué)研究與應(yīng)用[M].北京語(yǔ)言學(xué)院出版社,1993:134.

        猜你喜歡
        自然語(yǔ)言處理
        基于LSTM自動(dòng)編碼機(jī)的短文本聚類(lèi)方法
        自然語(yǔ)言處理與司法案例
        國(guó)外基于知識(shí)庫(kù)的問(wèn)答系統(tǒng)相關(guān)研究進(jìn)展及其啟示
        基于依存句法的實(shí)體關(guān)系抽取
        基于組合分類(lèi)算法的源代碼注釋質(zhì)量評(píng)估方法
        面向機(jī)器人導(dǎo)航的漢語(yǔ)路徑自然語(yǔ)言組塊分析方法研究
        詞向量的語(yǔ)義學(xué)規(guī)范化
        漢哈機(jī)器翻譯中的文字轉(zhuǎn)換技術(shù)研究
        HowNet在自然語(yǔ)言處理領(lǐng)域的研究現(xiàn)狀與分析
        科技視界(2016年5期)2016-02-22 11:41:39
        基于.NET的維哈柯多語(yǔ)種網(wǎng)上數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
        国产一区二区三区在线电影| 色综合久久五月天久久久| 最新日韩精品视频免费在线观看| av中文字幕在线直播| 狠狠综合亚洲综合亚洲色| 国产ww久久久久久久久久| 日产精品久久久久久久蜜臀| 亚洲va欧美va人人爽夜夜嗨| 亚洲精品亚洲人成在线下载| 色综合久久五月天久久久| 人妻在线有码中文字幕| 国产一品二品精品在线| 亚洲中文字幕人妻av在线| 四虎成人精品在永久免费| 无码人妻久久一区二区三区免费| 国产精品igao视频| 日本在线观看不卡| av在线手机中文字幕| 97超碰国产成人在线| 狠狠噜狠狠狠狠丁香五月| 国产99久久亚洲综合精品| 99亚洲乱人伦精品| 在线看高清中文字幕一区| 国产精品国产三级国产av品爱 | 国产精品成熟老女人| 亚洲一线二线三线写真| 啪啪网站免费观看| 最新日本久久中文字幕| 77777亚洲午夜久久多喷| 无码乱人伦一区二区亚洲一| 久久久久久久妓女精品免费影院| 国模一区二区三区白浆| 亚洲黄色一级在线观看| 欧洲美女黑人粗性暴交视频| 肥臀熟女一区二区三区| 午夜短无码| 中文字幕久久国产精品| 亚洲精品人成中文毛片| 亚洲av无码专区在线播放中文 | 人妻丰满熟妇一二三区| 亚洲av成人一区二区|