亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        世界最大的自然語言處理和語音技術(shù)實(shí)驗(yàn)室

        2007-12-31 00:00:00趙鐵軍朱聰慧
        計(jì)算機(jī)教育 2007年11期

        哈爾濱工業(yè)大學(xué)語言語音教育部-微軟重點(diǎn)實(shí)驗(yàn)室,以哈工大計(jì)算機(jī)學(xué)院語言技術(shù)研究中心為主要依托,由機(jī)器智能與翻譯實(shí)驗(yàn)室、智能技術(shù)與自然語言處理實(shí)驗(yàn)室、信息檢索實(shí)驗(yàn)室和語音處理實(shí)驗(yàn)室聯(lián)合組成,由教育部和微軟亞洲研究院聯(lián)合支持并資助。到目前為止,先后有200多名教師和學(xué)生加入實(shí)驗(yàn)室進(jìn)行研究工作,是目前世界上規(guī)模最大的自然語言處理和語音技術(shù)實(shí)驗(yàn)室。

        1發(fā)展歷程

        在微軟亞洲研究院的成立之初,微軟就與哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院開展了密切的合作,為如今深入廣泛的合作打下了深厚的基礎(chǔ)。

        首先,早在2000年6月,哈工大80周年校慶之際,時(shí)任微軟亞洲研究院院長(zhǎng)的李開復(fù)博士和任哈工大黨委書記的李生教授就對(duì)具體合作事宜達(dá)成了一致意見。“哈工大-微軟機(jī)器翻譯技術(shù)聯(lián)合實(shí)驗(yàn)室”在哈工大校慶期間揭牌,開辟了雙方合作之路。合作之初,哈工大方面的合作主體是機(jī)器智能翻譯研究室,當(dāng)時(shí)約有師生40人。這是微軟在中國設(shè)立的唯一的機(jī)器翻譯聯(lián)合實(shí)驗(yàn)室,隨后的4年中,雙方探討并嘗試了多種合作方式,并將其中成功的合作經(jīng)驗(yàn),延續(xù)至今。例如:雙方首先共同確定培養(yǎng)計(jì)劃,然后哈工大派遣研究生到微軟亞洲研究院實(shí)習(xí),由微軟亞洲研究院幫助培養(yǎng);雙方互相派遣學(xué)者訪問,增進(jìn)了解,互通有無;共同邀請(qǐng)國內(nèi)外專家學(xué)者,舉辦研討會(huì),決定研究規(guī)劃和研究策略;研究院將部分基礎(chǔ)性研究,委托聯(lián)合實(shí)驗(yàn)室進(jìn)行;研究院資助聯(lián)合實(shí)驗(yàn)室一定的相關(guān)軟硬件等。在這一階段的探討中,不僅積累了寶貴的合作經(jīng)驗(yàn),而且獲得了豐碩的研究成果,具體包括雙語(英漢)語料庫詞匯對(duì)齊工具研究、雙語(英漢)語料庫加工、雙語(英漢)語料庫自動(dòng)對(duì)齊算法研究、翻譯知識(shí)自動(dòng)獲取技術(shù)研究、便攜式實(shí)例翻譯系統(tǒng)、中英文統(tǒng)計(jì)句法分析器等研究課題和項(xiàng)目。而且還培養(yǎng)了一批優(yōu)秀的研究人員,這是雙方合作的第一個(gè)高潮。

        在2004年6月,基于“哈工大-微軟機(jī)器翻譯技術(shù)聯(lián)合實(shí)驗(yàn)室”所做出的成績(jī)以及哈工大在語言語音處理研究方面的研究成果,將已有實(shí)驗(yàn)室進(jìn)一步擴(kuò)大成為必然。2004年6月4日至6日,時(shí)值“哈工大-微軟機(jī)器翻譯聯(lián)合實(shí)驗(yàn)室”成立4周年之際,微軟亞洲研究院院長(zhǎng)沈向洋博士等一行7人訪問哈工大。鑒于過去四年聯(lián)合實(shí)驗(yàn)室取得的成績(jī),雙方一致同意把合作范圍從原來單純的機(jī)器翻譯進(jìn)一步擴(kuò)展到自然語言和語音技術(shù)的研究,“哈工大-微軟機(jī)器翻譯聯(lián)合實(shí)驗(yàn)室”的名稱也相應(yīng)地改為“哈工大-微軟自然語言處理及語音技術(shù)聯(lián)合實(shí)驗(yàn)室”。這是雙方合作進(jìn)一步深入和廣泛的明顯標(biāo)志。哈工大的合作主體,也由原來單獨(dú)的機(jī)器智能與翻譯研究室擴(kuò)展到了智能技術(shù)與自然語言處理研究室、信息檢索研究室和語音處理研究室,這不但豐富了雙方合作所涉及的范圍,而且也加強(qiáng)了聯(lián)合實(shí)驗(yàn)室整體研究的能力,這種合作框架一直保留至今。同年11月份,經(jīng)教育部批準(zhǔn),聯(lián)合實(shí)驗(yàn)室被批準(zhǔn)為教育部重點(diǎn)實(shí)驗(yàn)室,這是我們與微軟亞洲研究院合作歷史上的里程碑,也是對(duì)我們之前合作的極大肯定,聯(lián)合實(shí)驗(yàn)室的合作被提到了新的高度,從此雙方合作更加正式規(guī)范,重點(diǎn)實(shí)驗(yàn)室正式誕生,雙方的合作進(jìn)入了第二個(gè)高潮。

        在2006年7月,“教育部-微軟語言語音重點(diǎn)實(shí)驗(yàn)室”深圳分部成立,雙方開始共同探討深入研究的新策略,這是雙方合作過程中的一個(gè)重大嘗試和突破,雙方合作日益成熟。

        2人員構(gòu)成與組織結(jié)構(gòu)

        “哈工大語言語音教育部-微軟重點(diǎn)實(shí)驗(yàn)室”現(xiàn)由李生教授(哈工大)、周明博士(微軟)總體上負(fù)責(zé)和規(guī)劃,并分別擔(dān)任各方的主任;由王曉龍教授、趙鐵軍教授、韓紀(jì)慶教授和劉挺教授分別主持負(fù)責(zé)相關(guān)研究室的具體工作,擔(dān)任副主任。為了加強(qiáng)重點(diǎn)實(shí)驗(yàn)室的學(xué)術(shù)研究實(shí)力和研究氛圍,我們還為此成立了學(xué)術(shù)委員會(huì),包括微軟亞洲研究院洪小文副院長(zhǎng)在內(nèi)的海內(nèi)外多名知名專家擔(dān)任委員,極大加強(qiáng)了重點(diǎn)實(shí)驗(yàn)室的整體研究實(shí)力。

        重點(diǎn)實(shí)驗(yàn)室現(xiàn)有教師21人(其中教授7人,博導(dǎo)6人),在校博士研究生51人,本部碩士研究生95人,深圳分部40余人以及部分本科生,構(gòu)成了一個(gè)完善的立體的研究體系,重點(diǎn)實(shí)驗(yàn)室下設(shè)四個(gè)研究室和一個(gè)分部,分別是:機(jī)器智能與翻譯研究室、智能技術(shù)與自然語言處理研究室、信息檢索研究室、語音處理研究室和深圳分部(哈工大深圳研究生院)。其中前四個(gè)研究室位于哈工大本部,主要致力于相關(guān)方向的科學(xué)研究,注重培養(yǎng)研究型人才;而深圳分部,主要側(cè)重于將研究室的研究成果轉(zhuǎn)化為實(shí)際應(yīng)用,偏重培養(yǎng)工程型人才。

        3研究?jī)?nèi)容

        重點(diǎn)實(shí)驗(yàn)室研究領(lǐng)域廣泛,主要集中在語言和語音兩個(gè)重點(diǎn)上。語言處理方向上的具體研究集中在智能中文信息處理平臺(tái)設(shè)計(jì)與搭建,語句級(jí)中文輸入法模型研究,機(jī)器翻譯技術(shù)、資源、評(píng)價(jià)的研究,面向互聯(lián)網(wǎng)的信息檢索,問答系統(tǒng)、信息抽取與文本挖掘,自動(dòng)文摘,詞法、句法和語義分析,自然語言生成等,基本上涵蓋了自然語言處理研究的各個(gè)方面;語音處理的具體研究圍繞在頑健語音識(shí)別與聲控技術(shù),基于語音的信息安全技術(shù)和音頻信息檢索技術(shù)等方面。在這些研究領(lǐng)域,重點(diǎn)實(shí)驗(yàn)室都投入了大量人力和物力進(jìn)行相關(guān)研究。

        其中“短語翻譯對(duì)評(píng)價(jià)”由已經(jīng)畢業(yè)的一位博士負(fù)責(zé),在其攻讀博士學(xué)位期間,曾在微軟亞洲研究院實(shí)習(xí)。短語翻譯對(duì)是指互為翻譯的源語言與目標(biāo)語短語對(duì),通常是從雙語句對(duì)中獲取的。在抽取過程中,僅對(duì)源語言句子進(jìn)行句法分析,以詞對(duì)齊結(jié)果為依據(jù)獲取源語言短語的譯文。由于在抽取過程要受到詞對(duì)齊工具和漢語句法分析器精度的影響,因而在獲取的等價(jià)對(duì)中會(huì)存在著大量的噪聲。必須對(duì)其進(jìn)行評(píng)價(jià)以消除其中的噪聲。在抽出的等價(jià)對(duì)中,其左部是一個(gè)包含句法信息的漢語短語,右部是一個(gè)英語短語。在過濾中,僅考慮源語言與目標(biāo)語短語。例如,在判斷‘VO[靠/vg 窗戶/ng]->near the window’是否為一個(gè)正確的短語翻譯對(duì)時(shí),僅考慮‘靠窗戶->near the window’。在對(duì)短語翻譯對(duì)進(jìn)行評(píng)分時(shí),使用了短語譯文直譯率L(Phc,Phe)、短語對(duì)齊概率P(Phc|Phe)和短語長(zhǎng)度差異L1,L2,L3,L4為消歧特征對(duì)短語翻譯對(duì)進(jìn)行評(píng)價(jià)。同時(shí)以這六種消歧特征為基礎(chǔ),使用多種機(jī)器學(xué)習(xí)方法以提高評(píng)價(jià)的性能,最后通過深入研究,我們?nèi)〉昧吮容^好的實(shí)驗(yàn)結(jié)果,完全達(dá)到了任務(wù)確立之初的要求。

        4相關(guān)成果

        在雙方的緊密合作下,重點(diǎn)實(shí)驗(yàn)室的研究能力得到了飛速發(fā)展,自2000年以來,重點(diǎn)實(shí)驗(yàn)室先后承擔(dān)國家及部委科研項(xiàng)目近40項(xiàng),其中國家863計(jì)劃5項(xiàng),國家自然科學(xué)基金重點(diǎn)項(xiàng)目1項(xiàng),國家自然科學(xué)基金面上項(xiàng)目16項(xiàng),部委項(xiàng)目15項(xiàng),并且獲得省部級(jí)科技進(jìn)步二等獎(jiǎng)6項(xiàng),三等獎(jiǎng)5項(xiàng)。特別是在2005年,重點(diǎn)實(shí)驗(yàn)室承擔(dān)的微軟基金項(xiàng)目“復(fù)述技術(shù)研究”,經(jīng)過加工提煉,獲得國家自然科學(xué)基金的資助。重點(diǎn)實(shí)驗(yàn)室和微軟聯(lián)合申請(qǐng)的基金“語音檢索”的國家自然科學(xué)基金項(xiàng)目,也得到了微軟的資助。近2年內(nèi),重點(diǎn)實(shí)驗(yàn)室發(fā)表論文160余篇,其中在IEEE Transactions on Systems, Man and Cybernetics,Bioinformatics等國際期刊上發(fā)表5篇論文;在國際人工智能大會(huì)IJCAI’2007上發(fā)表2篇論文,在國際計(jì)算語言學(xué)大會(huì)Coling/ACL’2006上發(fā)表3篇論文,在國際計(jì)算語言學(xué)大會(huì)ACL’2007上發(fā)表1篇論文;在國內(nèi)重要期刊《中國科學(xué)》上發(fā)表1篇論文。在這些發(fā)表的論文中,英文論文達(dá)到總量的40%。重點(diǎn)實(shí)驗(yàn)室與研究院合作,在SIGIR、IJCAI和ACL等高水平國際會(huì)議上聯(lián)合發(fā)表論10余篇。在TREC 問答系統(tǒng)評(píng)測(cè)中,通過與全球30家參評(píng)單位,71個(gè)參評(píng)系統(tǒng)的角逐,取得了factoid問題評(píng)測(cè)中排名第五(國內(nèi)參評(píng)單位中排名第一),list問題評(píng)測(cè)中排名第七(國內(nèi)參評(píng)單位中排名第一)的好成績(jī)。在歷年的國家863評(píng)測(cè)中都取得了驕人的成果,具體包括:2003年文本分類系統(tǒng)獲第1名和自動(dòng)文摘評(píng)測(cè)第1名;2004年,文本分類系統(tǒng)再次獲第1名;2005年,信息檢索評(píng)測(cè)綜合指標(biāo)領(lǐng)先和詞對(duì)齊第1名。在2005國際SIGHAN漢語分詞評(píng)測(cè)中,由重點(diǎn)實(shí)驗(yàn)室提供的ICSU詞法分析系統(tǒng)獲得微軟語料開放測(cè)試第一名。2006年9月,重點(diǎn)實(shí)驗(yàn)室開始向?qū)W術(shù)界免費(fèi)開發(fā)共享語言技術(shù)平臺(tái)LTP(Language Technology Platform),該平臺(tái)是基于XML的文本機(jī)內(nèi)表示LTML(Language Technology Markup Language),目前已經(jīng)提供了9項(xiàng)自然語言處理關(guān)鍵技術(shù)模塊,包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、詞義消歧、句法分析、語義角色標(biāo)注、指代消解、自動(dòng)文摘、自動(dòng)分類等,已有國內(nèi)外70余家學(xué)術(shù)機(jī)構(gòu)簽署協(xié)議,共享了這個(gè)平臺(tái)。這些成績(jī)的獲得是我們研究能力不斷提高的證明,也是雙方成功合作的體現(xiàn)。

        我們和微軟亞洲研究院不但在研究項(xiàng)目上開展了廣泛的合作,在學(xué)術(shù)交流上更是卓有成效。2000年7月,加拿大蒙特利爾大學(xué)聶建云博士和微軟亞洲研究院高劍峰博士來聯(lián)合實(shí)驗(yàn)室講學(xué),并就如何撰寫學(xué)術(shù)論文為研究生進(jìn)行了實(shí)例點(diǎn)評(píng)。2002年8月,聯(lián)合實(shí)驗(yàn)室部分師生參加微軟亞洲研究院在北京舉行的自然語言處理培訓(xùn)班。2002年12月,微軟亞洲研究院自然語言計(jì)算組主任研究員周明博士訪問哈工大,并為聯(lián)合實(shí)驗(yàn)室?guī)熒鲗W(xué)術(shù)報(bào)告。在重點(diǎn)實(shí)驗(yàn)室成立后,微軟亞洲研究院先后為重點(diǎn)實(shí)驗(yàn)室作了10余次高水平的技術(shù)報(bào)告,特別是在微軟亞洲研究院的支持下,重點(diǎn)實(shí)驗(yàn)室成功承辦了2005和2006微軟暑期自然語言處理技術(shù)方面的專題研討班。研討班邀請(qǐng)了國際頂級(jí)學(xué)者,向全國的同行、學(xué)生開放,介紹國際自然語言處理技術(shù)的最新進(jìn)展。2005年6月1日到3日在哈爾濱工業(yè)大學(xué)舉辦了微軟亞洲研究院信息抽取暑期研討班。來自全國20所大學(xué)的研究生和博士生以及教師參加了這次研討班。研討班有四位主講老師,他們是微軟亞洲研究院自然語言組研究員牛成博士,新加坡國立大學(xué)教授黃偉道博士(黃偉道博士也是當(dāng)年ACL大會(huì)的程序委員會(huì)的主席)、微軟亞洲研究院語音組的研究員Frank Seide博士,以及美國南加州大學(xué)的林欽佑博士。牛成博士主講了信息抽取的基本技術(shù)、基本理論和應(yīng)用。黃偉道博士主講了信息抽取中的從無結(jié)構(gòu)和半結(jié)構(gòu)的文本中抽取信息的技術(shù)和語義角色標(biāo)注,F(xiàn)rank Seide博士主講了語音信息的抽取和檢索。林欽佑博士主講了信息抽取在自動(dòng)文摘技術(shù)的應(yīng)用。在6月1日的開幕式中,哈工大的李生教授、哈工大計(jì)算機(jī)學(xué)院副院長(zhǎng)王亞東教授致詞,周明主任研究員代表微軟亞洲研究院致詞,參加會(huì)議的還有微軟亞洲研究院的大學(xué)關(guān)系部門的馬昕經(jīng)理。大會(huì)的最后一天就研討班講授的內(nèi)容組織了練習(xí),全部同學(xué)被分成10組。每一組可以選擇六道題中的一道題。經(jīng)過一個(gè)半小時(shí)的討論之后,每一組選出一位代表上臺(tái)作報(bào)告。然后選出了兩個(gè)表現(xiàn)優(yōu)勝的組,頒發(fā)了獎(jiǎng)品。另外對(duì)所有發(fā)言的同學(xué),也都給予了獎(jiǎng)勵(lì),這期研討班為國內(nèi)相關(guān)研究領(lǐng)域培養(yǎng)了一大批生力軍,取得了圓滿成功,也為下一期研討班的舉行奠定了基礎(chǔ)。2006年7月10日到11日在重點(diǎn)實(shí)驗(yàn)室的深圳分部舉行了微軟新一代互聯(lián)網(wǎng)信息處理技術(shù)暑期研討班,在研討班舉行期間,微軟亞洲研究院副院長(zhǎng)、著名語音專家、微軟搜索技術(shù)中心主任洪小文博士;著名語音專家、香港中文大學(xué) Helen Meng教授;著名移動(dòng)計(jì)算專家、微軟移動(dòng)(深圳)研發(fā)中心研發(fā)總監(jiān)劉希輝女士;著名在線廣告和搜索技術(shù)研究專家、微軟亞洲研究院研究員陳正博士;著名信息檢索專家、加拿大蒙特利爾大學(xué)聶建云教授;著名自然語言處理專家、微軟亞洲研究院研究員林欽佑博士;著名計(jì)算機(jī)圖形學(xué)、數(shù)字游戲?qū)<?、微軟亞洲研究院研究員周昆博士等10余名專家,都就自己所擅長(zhǎng)的研究方法,為參加人員作了的精彩報(bào)告。使參加研討班的全國120多位教師和學(xué)生了解了相關(guān)領(lǐng)域最前沿的研究狀況,開拓了眼界,為今后進(jìn)一步深入研究打下了堅(jiān)實(shí)基礎(chǔ)。

        5人才培養(yǎng)

        在靈活的合作機(jī)制下,重點(diǎn)實(shí)驗(yàn)室已經(jīng)陸續(xù)派遣了來自下設(shè)4個(gè)研究室的40多位研究生,訪問了微軟研究院自然語言計(jì)算組和其他研究組。通過在微軟亞洲研究院,這個(gè)世界頂級(jí)的研究機(jī)構(gòu)的鍛煉,極大提高了這些訪問學(xué)生的科研能力,為重點(diǎn)實(shí)驗(yàn)室培養(yǎng)了寶貴人才,例如呂雅娟獲得2000年微軟學(xué)者獎(jiǎng)學(xué)金,車萬翔獲得2005年微軟學(xué)者獎(jiǎng)學(xué)金。

        重點(diǎn)實(shí)驗(yàn)室也為相關(guān)研究領(lǐng)域輸送了大量?jī)?yōu)秀人才,為整個(gè)研究領(lǐng)域的發(fā)展作出了不可磨滅的貢獻(xiàn)。作為微軟亞洲研究院自然語言計(jì)算組主任研究員的周明博士,就畢業(yè)于重點(diǎn)實(shí)驗(yàn)室。此外工作在新加坡信息通訊技術(shù)研究院的張民博士、工作在美國Amazon的劉小虎博士、工作在日本NICT的曹海龍博士、現(xiàn)任東芝中國研發(fā)中心,副所長(zhǎng)的王海峰博士、現(xiàn)任北京富士通研究開發(fā)中心,信息技術(shù)研究部部長(zhǎng)代理的于浩博士也都出自重點(diǎn)實(shí)驗(yàn)室。我們還為國內(nèi)高校及研究所的研究和教育,輸送了一批優(yōu)秀人才,例如工作于北京語言文化大學(xué)的荀恩東博士,工作于中科院計(jì)算所的呂雅娟博士,工作于蘇州大學(xué)的姚建民博士等。這些人在自己的崗位上繼續(xù)深化研究,帶動(dòng)了相關(guān)領(lǐng)域的進(jìn)一步發(fā)展。

        “教育部-微軟語言語音重點(diǎn)實(shí)驗(yàn)室”在哈工大計(jì)算機(jī)學(xué)院和微軟亞洲研究院長(zhǎng)期穩(wěn)定的合作的支持下,以優(yōu)勢(shì)互補(bǔ),友好協(xié)商,共同發(fā)展為合作原則,到目前為止,實(shí)驗(yàn)室已完成或正在實(shí)施的重要科研項(xiàng)目已接近40項(xiàng),包括國家自然科學(xué)基金(重點(diǎn))項(xiàng)目、863計(jì)劃(重點(diǎn))項(xiàng)目、省部級(jí)攻關(guān)項(xiàng)目、國際合作項(xiàng)目等;已發(fā)表論文400多篇。目前實(shí)驗(yàn)室研究人員包括博士導(dǎo)師6人、具有博士學(xué)位的副教授8人、在職教師21人,博士研究生50余人、碩士研究生140余人,為相關(guān)研究領(lǐng)域輸送了大量人才。我們會(huì)再接再厲,不斷探索開拓合作方式,在更廣泛的領(lǐng)域開展更深入細(xì)致的合作,為相關(guān)研究領(lǐng)域的整體進(jìn)步,貢獻(xiàn)自己的力量。

        免费观看在线一区二区| 国产精品美女久久久久久久久| 日韩毛片在线| 精品久久久亚洲中文字幕| 日本视频一区二区三区观看| 国产精品毛片va一区二区三区| 狠狠色噜噜狠狠狠狠色综合久 | 国产精品深夜福利免费观看| 风间由美中文字幕在线| 第一次处破女18分钟高清| 少妇性荡欲视频| 国产精品久久久久久2021| 白白白色视频在线观看播放| av天堂精品久久综合网| 久久夜色精品国产欧美乱| 99精品国产兔费观看久久| 日本av一区二区三区四区| 亚洲 日本 欧美 中文幕| 午夜精品久久久久久中宇| 无码a级毛片免费视频内谢| 国产一区二区黑丝美胸| 中文字幕中文有码在线| 亚洲成av人最新无码| 一本久久综合亚洲鲁鲁五月夫| 久久精品人妻少妇一二三区| a级毛片高清免费视频就| 香蕉视频免费在线| 免费看片的网站国产亚洲| 亚洲乱码国产乱码精品精| 日本一区二区不卡视频| 久久麻豆精亚洲av品国产精品 | 欧美大片aaaaa免费观看| 国产欧美日韩在线观看| 91麻豆精品一区二区三区| 老鲁夜夜老鲁| av片在线观看免费| 久久人妻av无码中文专区| 国产精品三区四区亚洲av| 免费观看的a级毛片的网站| 国产精品国产三级在线高清观看| 亚洲av一区二区在线|