《中國語言生活狀況報告(2006)》(下編)進(jìn)入“收官”階段,為便于讀者閱讀和使用本書數(shù)據(jù)和圖表,有必要將成果背后無法反映的一些情況作個補充說明。
2006年5月22日,教育部召開第11次新聞發(fā)布會,國家語委發(fā)布2005年中國語言生活狀況報告及相關(guān)數(shù)據(jù)。這是中國第一次就年度的語言使用實態(tài)發(fā)布報告,引起了社會和國內(nèi)外學(xué)術(shù)界的關(guān)注。發(fā)布會上,教育部副部長、國家語委主任趙沁平在題為《關(guān)注語言國情,建設(shè)和諧的語言生活》的書面講話中明確指出:“這項工作我們會持續(xù)做下去,每年公布語言生活狀況報告,以引導(dǎo)社會語言生活向著健康和諧的方向發(fā)展,為國家語言文字政策的制定、調(diào)整和學(xué)術(shù)研究提供參考?!鼻咂酵径啻螌ξ覀冎v:科學(xué)發(fā)展有賴于政府的科學(xué)決策??茖W(xué)決策首先需要宏觀數(shù)據(jù)的支持,此外還要有國內(nèi)外深入的調(diào)查研究和比較研究,以及向資深專家進(jìn)行咨詢,這三者加起來才能正確、科學(xué)地決策。沁平同志還要求有關(guān)部門,把基于數(shù)據(jù)分析的戰(zhàn)略研究作為部門建設(shè)的重點和基本任務(wù)來抓。本書的數(shù)據(jù)處理和報告撰寫,就是根據(jù)沁平同志的上述指示進(jìn)行的。
去年新聞發(fā)布會后,國家語言資源監(jiān)測與研究中心立即著手搜集新聞媒體和社會反應(yīng),及時分析、總結(jié)2005年數(shù)據(jù)發(fā)布工作,并于同年8月在福建省廈門市召開有5個分中心學(xué)術(shù)負(fù)責(zé)人參加的工作會議,研討和部署2006年數(shù)據(jù)發(fā)布工作。此次會議既是2005年數(shù)據(jù)發(fā)布工作的總結(jié)會,也是研討和啟動新課題的動員會。當(dāng)時,《中國語言生活狀況報告(2005)》(下編)尚未正式出版,而新的數(shù)據(jù)發(fā)布任務(wù)項目就已經(jīng)緊鑼密鼓地策劃和布置了。從課題啟動到《中國語言生活狀況報告(2006)》(下編)成書,相應(yīng)的語料庫建設(shè)、數(shù)據(jù)處理、統(tǒng)計分析和報告撰寫、修改定稿等工作,差不多進(jìn)行了將近一年?,F(xiàn)在大家看到的,就是國家語言資源監(jiān)測與研究中心對中國2006年平面媒體語言、有聲媒體語言、網(wǎng)絡(luò)媒體語言和教育教材語言進(jìn)行監(jiān)測研究,所得出的最新成果。
此次調(diào)查和發(fā)布的數(shù)據(jù),除保留“報紙、廣播電視、網(wǎng)絡(luò)(新聞)用字用語調(diào)查”外,增加了“報紙、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用狀況調(diào)查”“漢語作為第二語言教材字、詞和詞語義項調(diào)查”“漢語年度新詞語”等內(nèi)容。有聲媒體語言分中心今年首次參與到年度流行語研究中來,形成報紙、廣播電視流行語一起發(fā)布的態(tài)勢,發(fā)表的研究報告?zhèn)戎赜谘芯糠椒ê图夹g(shù)路線的描述和探討,本年度該專題還就流行語的界定等組織了小型學(xué)術(shù)研討會,從而使流行語的自動提取和發(fā)布提高了一個層次。網(wǎng)絡(luò)語言監(jiān)測研究方面,增加了“中文網(wǎng)絡(luò)用字用語調(diào)查”和“中文博客用字用語專項調(diào)查”的內(nèi)容,而“中文網(wǎng)絡(luò)BBS用字用語專項調(diào)查”則囊括了7所高校BBS網(wǎng)站和7個社會類BBS站點,取樣更有代表性。即使是與去年相同的調(diào)查題目(如“報紙、廣播電視、網(wǎng)絡(luò)(新聞)用字用語調(diào)查”),在方法上也沒有簡單照搬,調(diào)查統(tǒng)計項目增添了在計算機自動分詞的基礎(chǔ)上區(qū)分詞性等內(nèi)容,難度陡然增大,遇到許多需要探索攻關(guān)的課題;最后公布的數(shù)據(jù),也沒有簡單地羅列字表、詞語表,而是增設(shè)了不少與2005年的相關(guān)數(shù)據(jù)進(jìn)行比較的項目,讀者從中可以清楚地看出年度用字用語的動態(tài)變化?!皥蠹?、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用狀況調(diào)查”,在目前技術(shù)手段受到限制的情況下,盡可能地對夾雜在漢字中的字母形式使用情況作了較全面的調(diào)查,有關(guān)字母詞語的統(tǒng)計數(shù)據(jù),可以為了解和把握字母詞語在漢語系統(tǒng)中的分布提供參考?!皾h語作為第二語言教材字、詞和詞語義項調(diào)查”,抽取現(xiàn)行12種不同類型、不同學(xué)習(xí)對象的對外漢語教材,細(xì)致解剖其詞語使用情況,其中的詞語義項、義頻統(tǒng)計分析,以往沒有人做過,不失為一次初步而有益的嘗試,可能會為對外漢語教材詞語研究摸索出一條新路子,也從一個側(cè)面顯示出計算機輔助教材詞語研究的深化。此外,為了幫助讀者形象、直觀地了解本書數(shù)據(jù),我們繪(編)了大量的圖表(計表格124個,附表11個,圖25個,合計圖表160個)。總之,與已經(jīng)發(fā)布的2005年數(shù)據(jù)相比,本年度的調(diào)研范圍、領(lǐng)域有所拓展、加深,研究方法有新的改進(jìn),技術(shù)含量明顯提高,數(shù)據(jù)所體現(xiàn)出的信度和可靠性進(jìn)一步增強。
調(diào)查統(tǒng)計和撰寫報告過程中,始終遵循實事求是的原則?!皩嵤虑笫恰斌w現(xiàn)在兩個方面:一是力求客觀記錄語言文字使用的實態(tài),二是吸收和改進(jìn)現(xiàn)有技術(shù)手段,在記錄語言文字使用實態(tài)的過程中努力體現(xiàn)出技術(shù)“實態(tài)”的最新進(jìn)展和較高水平。兩個“實態(tài)”缺一不可,前者是追求的目標(biāo),后者是實現(xiàn)目標(biāo)的手段和方法上的改進(jìn)。隨著科技的進(jìn)步,中文信息處理技術(shù)發(fā)展非???,使得我們現(xiàn)在有條件運用計算機、語料庫和數(shù)理統(tǒng)計的方法定期發(fā)布監(jiān)測數(shù)據(jù),開展語言使用實態(tài)的研究,這是非常了不起的進(jìn)步!但是,技術(shù)的發(fā)展和走向成熟需要一個過程,由于多方面原因,現(xiàn)有的信息技術(shù)手段在處理語言文字時尚有一些“瓶頸”問題(如自動分詞和提高詞性標(biāo)注的準(zhǔn)確率等)沒有得到圓滿解決,也在一定程度上影響甚至阻礙著統(tǒng)計數(shù)據(jù)和研究報告質(zhì)量的進(jìn)一步提升。因此可以說,發(fā)布中國語言使用狀況報告和相關(guān)數(shù)據(jù),既得益于信息技術(shù)的發(fā)展,也受制于目前信息技術(shù)水平的“實態(tài)”,這是需要信息處理界和語言學(xué)界合力攻關(guān)才能逐步解決的問題。在《中國語言生活狀況報告(2006)》(下編)數(shù)據(jù)處理和報告撰寫遇到需要攻關(guān)的問題時,我們時常采取請教信息處理專家,或者召開信息處理和語言學(xué)專家都參加的專題研討會等方式,探索某些無法回避的技術(shù)“瓶頸”問題的處理策略,力爭使所采用的技術(shù)“實態(tài)”能夠代表最新和較高發(fā)展水平。當(dāng)然這類問題目前解決得還不是很理想,這是需要說明的。
還有一點需要說明的是,利用現(xiàn)代信息技術(shù)手段對動態(tài)、鮮活的年度語言文字使用狀況進(jìn)行數(shù)據(jù)處理和初步分析,是一項全新的、具有開創(chuàng)意義的工作。工作開始的頭幾年主要還是探索性的,工具、手段都不是很完善、很成熟,人們對語言現(xiàn)象的認(rèn)識(語言觀和語言規(guī)范觀)也有許多不同。這種探索往往依賴于技術(shù)上的支持,而處理語言文字的信息技術(shù)眼下還有一定局限性,兼通語言學(xué)和計算機科學(xué)的“兩棲型”研究隊伍的培養(yǎng)建設(shè),目前也還不能滿足實際研究工作的需要,等等。在這種情況下,調(diào)查統(tǒng)計本身有些缺陷,數(shù)據(jù)有一點兒誤差應(yīng)該是允許的,事實上也是難免的。在本編的研究撰寫中,我們遇到了局外人難以想象的困難,付出了比編寫其他著作辛苦得多的巨大努力,除召開4次專家審稿會外,本編還針對研究難點和數(shù)據(jù)處理中遇到的問題約請有關(guān)專家開了3次專題研討會、4次專題審稿會,各位審訂和責(zé)編更是嚴(yán)格把關(guān)。盡管如此,數(shù)據(jù)和報告中的不足和疏漏之處依然在所難免,懇請讀者不吝賜教,幫助年度語言生活狀況報告的數(shù)據(jù)發(fā)布和撰寫工作逐步完善。
《中國語言生活狀況報告(2006)》(下編)是個集體項目。本編的研究撰寫,得到了國家語言資源監(jiān)測與研究中心所屬平面媒體語言分中心、有聲媒體語言分中心、網(wǎng)絡(luò)媒體語言分中心和教育教材語言分中心的通力協(xié)作和支持,南開大學(xué)文學(xué)院提供了2006年度新詞語的全部素材,我們從中選登了一些條目;商務(wù)印書館為本書出版提供了無私的幫助。對上述作者、出版者所做的工作,一并表示感謝!還有一些參加了相關(guān)語料庫建設(shè)的同志,作者名錄上雖然沒能留下他們的名字,但對其所做的大量基礎(chǔ)性工作也要表示感謝!文稿初稿完成后,從2007年2月起,我們先后邀請陳章太、戴慶廈、陸儉明、孫茂松和陳敏等專家分別審閱、修改了部分篇目;孫茂松參加了數(shù)據(jù)處理中若干技術(shù)問題的討論,提出許多有價值的意見;高永偉、張鐵文審讀了“報紙、廣播電視、網(wǎng)絡(luò)(新聞)字母詞語使用情況調(diào)查”的部分資料;晁繼周審讀了“漢語作為第二語言教材字、詞和詞語義項調(diào)查”的部分資料;于根元、周洪波、劉一玲、李志江等參加了年度新詞語詞條的討論;我和魏勵參加了審稿和修改加工的全過程。尤其難忘的是其中的幾次專題審稿會,審稿專家和作者一起討論切磋,逐字逐句地推敲修改,不知不覺就干到了后半夜,有些同志還是帶病堅持工作。我們認(rèn)為,發(fā)揚這種無私奉獻(xiàn)、團(tuán)結(jié)協(xié)作的精神和廢寢忘食、精益求精的工作態(tài)度,沒有什么困難是不能克服的;年度語言生活狀況報告一定會逐步成為一個品牌,越編越好!
(王鐵琨,教育部語言文字信息管理司副司長、中國文字學(xué)會副會長兼秘書長)