金 澎
(樂(lè)山師范學(xué)院 智能信息處理及應(yīng)用實(shí)驗(yàn)室, 四川 樂(lè)山 614004)
2010年4月18至19日,在樂(lè)山師范學(xué)院召開(kāi)了“超大規(guī)模語(yǔ)料庫(kù)精深加工及應(yīng)用研討會(huì)”。會(huì)議中心議題是交流在超大規(guī)模語(yǔ)料獲取、整理、加工方面的成果與經(jīng)驗(yàn),特別針對(duì)基于國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)的語(yǔ)言狀況調(diào)查中遇到的問(wèn)題進(jìn)行了深入討論。
此次會(huì)議由北京大學(xué)教育部計(jì)算語(yǔ)言學(xué)重點(diǎn)實(shí)驗(yàn)室組織,樂(lè)山師范學(xué)院計(jì)算機(jī)科學(xué)學(xué)院和智能信息處理及應(yīng)用實(shí)驗(yàn)室承辦。會(huì)議的動(dòng)機(jī)是通過(guò)交流,將已有的大規(guī)模語(yǔ)料庫(kù)加工的成果能夠有機(jī)地應(yīng)用于基于超大規(guī)模語(yǔ)料庫(kù)的語(yǔ)言狀況調(diào)查中。會(huì)上交流的研究成果包括“現(xiàn)代漢語(yǔ)虛詞用法知識(shí)庫(kù)研究及相關(guān)工具”、“漢字義類信息庫(kù)”、“漢語(yǔ)語(yǔ)義構(gòu)詞信息庫(kù)”、“現(xiàn)代漢語(yǔ)新詞語(yǔ)信息電子詞典”、“新編同義詞詞林”、“句子語(yǔ)義成分標(biāo)注語(yǔ)料庫(kù)”、“同形標(biāo)注語(yǔ)料庫(kù)及標(biāo)注、校對(duì)軟件”等。同時(shí),對(duì)面向語(yǔ)言監(jiān)測(cè)的分詞標(biāo)注工具的特點(diǎn)、新詞語(yǔ)、流行語(yǔ)提取的難點(diǎn)及對(duì)策等進(jìn)行了深入討論。達(dá)成了在超大規(guī)模語(yǔ)料庫(kù)的處理及精加工方面發(fā)揮各自所長(zhǎng),相互合作,共享成果的意向。
出席此次會(huì)議的專家學(xué)者包括:北京大學(xué)俞士汶教授、朱學(xué)鋒副教授、中國(guó)傳媒大學(xué)侯敏教授、魯東大學(xué)亢世勇教授、北京語(yǔ)言大學(xué)楊爾弘教授、鄭州大學(xué)昝紅英副教授、中國(guó)情報(bào)技術(shù)研究所劉耀副研究員、北京大學(xué)博士后劉鵬遠(yuǎn)、樂(lè)山師范學(xué)院金澎博士等。