亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能延伸科學(xué)交流觸角

        2019-09-10 07:22:44張蓋倫陸越
        科海故事博覽·下旬刊 2019年3期
        關(guān)鍵詞:人工智能文本

        張蓋倫 陸越

        近日,一款看起來挺有文化的寫稿機(jī)器人上線了。它叫小柯,由中國科學(xué)報(bào)社和北京大學(xué)科研團(tuán)隊(duì)共同研發(fā)。小柯寫的不是普通的稿子,而是中文科學(xué)新聞。據(jù)介紹,運(yùn)用自然語言處理技術(shù),小柯以英文論文摘要為基礎(chǔ),能夠快速寫出中文科學(xué)新聞底稿,然后由專業(yè)人士和報(bào)社的編輯進(jìn)行把關(guān)和完善信息,幫助科學(xué)家以中文方式快速獲取全球高水平英文論文中的最新科研進(jìn)展。目前小柯的作品已經(jīng)上線。人工智能的觸角,也在伸向各個(gè)領(lǐng)域。

        小柯:一個(gè)盡職的摘要翻譯轉(zhuǎn)寫者

        2019年7月5日,小柯機(jī)器人發(fā)出第一篇稿子,截至8月22日統(tǒng)計(jì)時(shí),小柯機(jī)器人共發(fā)稿415篇。初期更新時(shí)間距論文發(fā)表時(shí)間間隔一個(gè)月左右,現(xiàn)在可以做到當(dāng)天或隔天更新,每天更新幾篇到二十幾篇不等。所選論文來自生命科學(xué)等領(lǐng)域,涉及《自然》《細(xì)胞》《新英格蘭醫(yī)學(xué)雜志》等期刊。有記者對(duì)照分析了小柯的作品《單細(xì)胞測(cè)序揭示冠狀動(dòng)脈疾病保護(hù)機(jī)制》及其英文原文。文章中,小柯先對(duì)論文主題、研究單位以及發(fā)表的期刊進(jìn)行了簡單介紹,后接英文原文摘要的翻譯,大致反映原文內(nèi)容;翻譯時(shí)會(huì)對(duì)原文進(jìn)行適當(dāng)?shù)恼Z句簡化,同時(shí)在對(duì)專業(yè)詞語的翻譯上也使用了如“血管平滑肌細(xì)胞”“保護(hù)性纖維帽”等專業(yè)表述。不過,這也不全是小柯的功勞,因?yàn)楦寮l(fā)出前,還有人工審校這一步驟。北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所研究員萬小軍團(tuán)隊(duì)負(fù)責(zé)小柯的系統(tǒng)總體設(shè)計(jì)與聯(lián)合技術(shù)攻關(guān)。他告訴記者,目前機(jī)器翻譯系統(tǒng)的性能很大程度上依賴于其所使用的訓(xùn)練數(shù)據(jù),即平行語料。目前的平行語料多為新聞?wù)Z料,因此訓(xùn)練得到的機(jī)器翻譯模型對(duì)于日常新聞的翻譯效果較好。但學(xué)術(shù)文獻(xiàn)(比如生物學(xué)術(shù)論文)與日常新聞在用詞造句等方面都有較大差別,機(jī)器翻譯系統(tǒng)對(duì)于學(xué)術(shù)文獻(xiàn)翻譯的效果并不理想。這一次,他們通過融合領(lǐng)域知識(shí)進(jìn)行語句智能篩選,選擇適合大眾理解的語句,并基于語句簡化提升語句翻譯質(zhì)量。“英文學(xué)術(shù)論文摘要適合專業(yè)科研人員閱讀,但摘要中的語句并不都適合寫到科學(xué)新聞中面向大眾傳播,因此需要結(jié)合編輯提供的先驗(yàn)知識(shí),采用計(jì)算機(jī)算法對(duì)語句進(jìn)行篩選,保留適合進(jìn)行大眾新聞傳播的語句?!比f小軍說。

        機(jī)器人不只能寫稿

        研發(fā)小柯用了半年時(shí)間,萬小軍表示,和一般寫稿機(jī)器人相比,一個(gè)好的跨語言科技新聞寫稿機(jī)器人需要進(jìn)行兩次重要的信息轉(zhuǎn)換過程:一次是不同語言的轉(zhuǎn)換,將英文文本轉(zhuǎn)換為中文文本;另一次是語言風(fēng)格的轉(zhuǎn)換,將學(xué)術(shù)型文字表達(dá)轉(zhuǎn)換為大眾能夠接受的通俗文字表達(dá)?!斑@兩次轉(zhuǎn)換都具有較大的挑戰(zhàn)性,目前并沒有完全解決。后續(xù)還需要進(jìn)一步積累數(shù)據(jù),調(diào)整算法模型,才能取得更好的效果。”萬小軍說。接下來,團(tuán)隊(duì)還將繼續(xù)優(yōu)化小柯,讓它寫出的科學(xué)新聞內(nèi)容更豐富,表達(dá)更生動(dòng)。當(dāng)然,翻譯撰寫科技新聞稿件,只是自然語言處理等人工智能技術(shù)在學(xué)術(shù)交流中所能大顯身手的領(lǐng)域之一。“基本上,只要人類交流和工作過程中涉及語言和文字的地方,自然語言處理技術(shù)都有可能發(fā)揮作用?!比f小軍說,在科研論文寫作過程中,可以借助自然語言處理技術(shù)幫助推薦參考文獻(xiàn),并自動(dòng)生成related work等章節(jié)的文字;業(yè)界也有基于自然語言處理技術(shù)自動(dòng)編撰圖書的嘗試?!拔覀€(gè)人也接觸了很多很有意思也很有挑戰(zhàn)的應(yīng)用需求,但可惜的是不少需求都無法基于目前的自然語言處理技術(shù)進(jìn)行實(shí)現(xiàn)。自然語言處理技術(shù)還需要進(jìn)一步地發(fā)展和突破,我相信在未來將有更多的用武之地?!?/p>

        中國知網(wǎng)常務(wù)副總經(jīng)理張宏偉長期關(guān)注自然語言處理,大數(shù)據(jù)和人工智能方面的應(yīng)用研究。他告訴記者,在數(shù)字出版和知識(shí)服務(wù)的全鏈條中,你都能看到人工智能和機(jī)器學(xué)習(xí)技術(shù)的身影。人工智能可以對(duì)數(shù)字出版的選題策劃、協(xié)同撰稿、內(nèi)容編審進(jìn)行賦能。大數(shù)據(jù)標(biāo)注機(jī)器人則能對(duì)海量文獻(xiàn)信息資源進(jìn)行OCR文字識(shí)別,智能版面分析,知識(shí)元抽取,自動(dòng)分類,自動(dòng)標(biāo)引主題,自動(dòng)生成摘要,自動(dòng)翻譯,自動(dòng)標(biāo)注引用和參考文獻(xiàn)。人們熟悉的論文抄襲檢測(cè),同樣需要智能技術(shù)。它不是簡單的語句重復(fù)檢測(cè),而是要對(duì)文本內(nèi)容(包括圖片、公式、表格等)進(jìn)行語義索引,“看你在思想上有沒有抄襲別人”。如果存在不同語言之間的互抄,還需要?jiǎng)佑谩皺C(jī)器翻譯”。張宏偉表示,初級(jí)的語義抄襲可以由機(jī)器揪出來,不過,如果足夠有“心機(jī)”,就可以完全用自己的語言“洗”了別人的思想,對(duì)人工智能的技術(shù)要求一下就提高了許多。目前已有利用神經(jīng)網(wǎng)絡(luò)模型對(duì)文本內(nèi)容構(gòu)建高維度語義索引等新技術(shù)出現(xiàn),不管是中文還是英文,一律映射到一個(gè)統(tǒng)一的語義空間,實(shí)現(xiàn)真正基于內(nèi)容理解的語義級(jí)全文比對(duì)檢索。

        知識(shí)庫是智慧社會(huì)的基礎(chǔ)設(shè)施

        至于在學(xué)術(shù)研究中必不可少的資料索引,看似簡單,也仍然具有技術(shù)含量。張宏偉說,數(shù)字出版和數(shù)字圖書館的資源類型非常豐富,有大量文本、圖像和音視頻數(shù)據(jù),且數(shù)據(jù)是非結(jié)構(gòu)化的,若想對(duì)其進(jìn)行深度的挖掘利用,難度不小。就拿常見的信息檢索來說,首先得做到結(jié)果要全,相關(guān)度要高;再進(jìn)階一步,能不能用自然語言交互的方式檢索;升級(jí)一下難度,用智能問答的方式查找信息,能否直接給出答案?“要讓檢索功能變得更貼心,計(jì)算機(jī)要‘學(xué)會(huì)’閱讀資料,總結(jié)、推理然后回答。它需要把海量的數(shù)據(jù)資源變成自己可以理解的知識(shí)庫?!睆埡陚フf。深度學(xué)習(xí)等統(tǒng)計(jì)方法嚴(yán)重依賴于大樣本數(shù)據(jù),然而,現(xiàn)實(shí)世界中,很多實(shí)際問題僅僅依靠統(tǒng)計(jì)方法是無法解決的,這就需要建立專門的計(jì)算機(jī)能理解的知識(shí)庫,實(shí)現(xiàn)真正的人工智能。但構(gòu)建知識(shí)庫,本身是一項(xiàng)極其艱難且耗時(shí)漫長的工作。畢竟,機(jī)器和人對(duì)知識(shí)的理解方式大相徑庭。張宏偉說,像知網(wǎng)這樣的機(jī)構(gòu)正在致力于深度整合全球知識(shí)信息資源,建設(shè)世界知識(shí)大數(shù)據(jù)。也在讓文本文獻(xiàn)碎片化、網(wǎng)絡(luò)化,依據(jù)知識(shí)使用的場(chǎng)景,采用半自動(dòng)知識(shí)抽取算法來構(gòu)建面向垂直領(lǐng)域的知識(shí)圖譜。2019年知網(wǎng)陸續(xù)推出了一些基于知識(shí)圖譜的行業(yè)智慧應(yīng)用產(chǎn)品,如醫(yī)療領(lǐng)域的臨床智能診斷,法律領(lǐng)域的智能量刑判案等?!安贿^,我們?cè)谶@些領(lǐng)域剛剛起步。我個(gè)人覺得,還是要少一點(diǎn)浮躁,踏踏實(shí)實(shí)做一些基礎(chǔ)性的工作。沒有知識(shí)的支撐,就談不上‘智慧’?!痹趶埡陚タ磥?,知識(shí)庫和人工智能,本身就是互相促進(jìn)、相互賦能的關(guān)系。構(gòu)建知識(shí)庫需要人工智能,而人工智能的發(fā)展,也離不開知識(shí)庫。怎么將人類的知識(shí)庫轉(zhuǎn)換成計(jì)算機(jī)能理解的知識(shí)庫是人工智能的核心問題,面臨許多困難,需要學(xué)術(shù)界和產(chǎn)業(yè)界共同努力。

        猜你喜歡
        人工智能文本
        我校新增“人工智能”本科專業(yè)
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        在808DA上文本顯示的改善
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        下一幕,人工智能!
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        一级a免费高清免在线| 亚洲综合一区无码精品| 国产成人精品一区二区三区视频| 亚洲男人天堂| 色播在线永久免费视频网站| 国产农村妇女毛片精品久久麻豆| 亚洲国产成人极品综合| 久久精品国产亚洲av久| 欧美日韩视频无码一区二区三| 亚洲av鲁丝一区二区三区| 亚洲AV无码永久在线观看| 五月天亚洲av优女天堂| 免费国产不卡在线观看| 色综合久久久久综合体桃花网| 欧美日韩国产成人高清视频| chinesefreexxxx国产麻豆| 精品国产一区二区三区AV小说| 日韩av在线不卡一二三区| 人妻系列中文字幕av| 日韩人妻少妇一区二区三区| 亚洲综合精品成人| 国产成人一区二区三区高清| 蜜桃视频网站在线免费观看| 国产成人久久精品一区二区三区| 中文字幕色av一区二区三区| 久久精品国产亚洲av高清色欲| 国产精品欧美久久久久老妞| 精品理论一区二区三区| 中文字幕手机在线精品| 国产高清在线观看av片| 亚洲а∨精品天堂在线| 狠狠色综合播放一区二区| 国产麻豆成人精品av| 色欲色香天天天综合vvv| 人人玩人人添人人澡| 男人天堂AV在线麻豆| 男女射精视频在线观看网站| 日韩毛片无码永久免费看| 456亚洲老头视频| 日本一区人妻蜜桃臀中文字幕 | 日本久久久免费观看视频|