亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

自然語(yǔ)言處理技術(shù)不只能讓機(jī)器人寫(xiě)稿

2019-10-09 03:45:11張蓋倫陸越

科學(xué)導(dǎo)報(bào) 2019年51期

張蓋倫陸越

“基本上，只要人類(lèi)交流和工作過(guò)程中涉及到語(yǔ)言和文字的地方，自然語(yǔ)言處理技術(shù)都有可能發(fā)揮作用?！比f(wàn)小軍說(shuō)，在科研論文寫(xiě)作過(guò)程中，可以借助自然語(yǔ)言處理技術(shù)幫助推薦參考文獻(xiàn)，并自動(dòng)生成related work等章節(jié)的文字;業(yè)界也有基于自然語(yǔ)言處理技術(shù)自動(dòng)編撰圖書(shū)的嘗試?！拔覀€(gè)人也接觸到很多很有意思也很有挑戰(zhàn)的應(yīng)用需求，但可惜的是不少需求都無(wú)法基于目前的自然語(yǔ)言處理技術(shù)進(jìn)行實(shí)現(xiàn)。自然語(yǔ)言處理技術(shù)還需要進(jìn)一步地發(fā)展和突破，我相信在未來(lái)將有更多的用武之地。”

中國(guó)知網(wǎng)常務(wù)副總經(jīng)理張宏偉長(zhǎng)期關(guān)注自然語(yǔ)言處理，大數(shù)據(jù)和人工智能方面的應(yīng)用研究。他告訴筆者，在數(shù)字出版和知識(shí)服務(wù)的全鏈條中，你都能看到人工智能和機(jī)器學(xué)習(xí)技術(shù)的身影。

人工智能可以對(duì)數(shù)字出版的選題策劃、協(xié)同撰稿、內(nèi)容編審進(jìn)行賦能。大數(shù)據(jù)標(biāo)注機(jī)器人則能對(duì)海量文獻(xiàn)信息資源進(jìn)行OCR文字識(shí)別，智能版面分析，知識(shí)元抽取，自動(dòng)分類(lèi)，自動(dòng)標(biāo)引主題，自動(dòng)生成摘要，自動(dòng)翻譯，自動(dòng)標(biāo)注引用和參考文獻(xiàn)。

人們熟悉的論文抄襲檢測(cè)，同樣需要智能技術(shù)。它不是簡(jiǎn)單的語(yǔ)句重復(fù)檢測(cè)，而是要對(duì)文本內(nèi)容（包括圖片、公式、表格等）進(jìn)行語(yǔ)義索引，“看你在思想上有沒(méi)有抄襲別人”。如果存在不同語(yǔ)言之間的互抄，還需要?jiǎng)佑谩皺C(jī)器翻譯”。張宏偉表示，初級(jí)的語(yǔ)義抄襲可以由機(jī)器揪出來(lái)，不過(guò)，如果足夠有“心機(jī)”，完全用自己的語(yǔ)言“洗”了別人的思想，對(duì)人工智能的技術(shù)要求一下就提高了許多。目前已有利用神經(jīng)網(wǎng)絡(luò)模型對(duì)文本內(nèi)容構(gòu)建高維度語(yǔ)義索引等新技術(shù)出現(xiàn)，不管是中文還是英文，一律映射到一個(gè)統(tǒng)一的語(yǔ)義空間，實(shí)現(xiàn)真正基于內(nèi)容理解的語(yǔ)義級(jí)全文比對(duì)檢索。

知識(shí)庫(kù)是智慧社會(huì)的基礎(chǔ)設(shè)施

至于在學(xué)術(shù)研究中必不可少的資料索引，看似簡(jiǎn)單，也仍然具有技術(shù)含量。

張宏偉說(shuō)，數(shù)字出版和數(shù)字圖書(shū)館的資源類(lèi)型非常豐富，有大量文本、圖像和音視頻數(shù)據(jù)，且數(shù)據(jù)是非結(jié)構(gòu)化的，若想對(duì)其進(jìn)行深度的挖掘利用，難度不小。

深度學(xué)習(xí)等統(tǒng)計(jì)方法嚴(yán)重依賴于大樣本數(shù)據(jù)，然而，現(xiàn)實(shí)世界中，很多實(shí)際問(wèn)題僅僅依靠統(tǒng)計(jì)方法是無(wú)法解決的，這就需要建立專(zhuān)門(mén)的計(jì)算機(jī)能理解的知識(shí)庫(kù)，實(shí)現(xiàn)真正的人工智能。但構(gòu)建知識(shí)庫(kù)，本身是一項(xiàng)極其艱難且耗時(shí)漫長(zhǎng)的工作。畢竟，機(jī)器和人對(duì)知識(shí)的理解方式大相徑庭。

張宏偉說(shuō)，像知網(wǎng)這樣的機(jī)構(gòu)正在致力于深度整合全球知識(shí)信息資源，建設(shè)世界知識(shí)大數(shù)據(jù)。也在讓文本文獻(xiàn)碎片化、網(wǎng)絡(luò)化，依據(jù)知識(shí)使用的場(chǎng)景，采用半自動(dòng)知識(shí)抽取算法來(lái)構(gòu)建面向垂直領(lǐng)域的知識(shí)圖譜。2019年知網(wǎng)陸續(xù)推出了一些基于知識(shí)圖譜的行業(yè)智慧應(yīng)用產(chǎn)品，如醫(yī)療領(lǐng)域的臨床智能診斷，法律領(lǐng)域的智能量刑判案等。

“不過(guò)，我們?cè)谶@些領(lǐng)域剛剛起步。我個(gè)人覺(jué)得，還是要少一點(diǎn)浮躁，踏踏實(shí)實(shí)做一些基礎(chǔ)性的工作。沒(méi)有知識(shí)的支撐，就談不上‘智慧?！痹趶埡陚タ磥?lái)，知識(shí)庫(kù)和人工智能，本身就是互相促進(jìn)、相互賦能的關(guān)系。構(gòu)建知識(shí)庫(kù)需要人工智能，而人工智能的發(fā)展，也離不開(kāi)知識(shí)庫(kù)。怎么將人類(lèi)的知識(shí)庫(kù)轉(zhuǎn)換成計(jì)算機(jī)能理解的知識(shí)庫(kù)是人工智能的核心問(wèn)題，面臨許多困難，需要學(xué)術(shù)界和產(chǎn)業(yè)界共同努力。