“我國有著上下五千年的燦爛文明史,漢字是我們中華民族傳統(tǒng)文化的精髓,是華夏文明的瑰寶,也是全世界流傳至今最古老、最優(yōu)秀的語言文字。在步入網(wǎng)絡時代的今天,電腦的普及率代表了一個國家的信息化水平和文明發(fā)展程度。漢字能否駕馭網(wǎng)絡化信息時代,成了考核我國漢字現(xiàn)代化水平的標志,也是加速漢字國際化和中華文化走向世界的關鍵。中國空空導彈研究院華興初發(fā)明的漢字表征碼中文信息處理技術,為中國漢字走向世界作出了肯定的回答。
漢字文化傳承,困難重重
近年來,我國表面繁榮的電腦市場后面,早就種下了鮮為人知的“先進技術難登場,劣質(zhì)產(chǎn)品有市場”劣根,新世紀以來,往日轟轟烈烈的中文信息處理漢字編碼和輸入法發(fā)明運動黯然偏離了人們關注的視線,但這并不等于中文信息處理技術已日臻完善,而是一系列無法解決的難題令專家束手無策,甚至對“937計劃”部署的重大基礎技術—中文信息的獲取,至今沒有搞清。
中文信息處理技術至今仍存在諸多難題:“音盛形衰”,不能展現(xiàn)民族特色,提筆忘字,漢字還原率極低,錯別字成災;“編碼運動”忽視漢字的排序功能,各行各業(yè)的中文信息的查、檢方法落后,速度慢,字典有字查不到,電子字典的先進功能無法發(fā)揮,中文基礎教學部門墨守成規(guī),拒絕創(chuàng)新,“找不到”規(guī)范、易學、高效、減負的突破口;以五筆字型為代表的中文信息處理技術落后、復雜、難度大,電腦應用無法普及,開拓國內(nèi)市場都很有限,走向世界之路更是渺茫;低級雜亂的輸入方法無法規(guī)范統(tǒng)一,中文信息處理領域的全面規(guī)范化實際上沒做到,也做不到,我國的信息化社會進程無法有效融入世界;中國信息產(chǎn)業(yè)完全由外國掌控,手機沒有自主創(chuàng)新的知識產(chǎn)權,它的芯片92%由外國掌控,網(wǎng)絡安全也就掌握在外國人手里,在一定程度上危及國家安全;漢字信息壓縮技術并沒有徹底解決中文信息的輸出入問題,更沒有能力全面支持中文信息處理工作的正常開展,嚴重地制約中文走向現(xiàn)代化、國際化的進程;中文信息處理技術拿不出創(chuàng)新的亮點;無人敢提中文趕超英文的問題,長期以來,中文西化論阻礙了中文成為國際化的文字與語言的前進步伐;中文信息處理主流技術嘩眾取寵,濫用智能技術,把嚴肅神圣的中文糟踏得字不字、詞不詞、語不語、句不句,教壞了學生,擾亂了中文基礎教學的規(guī)律,還影響了國家的形象與民族的尊嚴。
創(chuàng)新突破,漢字表征碼問世
科技創(chuàng)新的本質(zhì)是把重大的、復雜的、長期解決不了的、看上去不可能解決的問題簡單化,而且越簡單越好。華興初發(fā)明的漢字表征碼中文輸入方法,完全做到了這一點,可以成為全世界從娃娃開始所有人都能掌握的通用技術。
漢字表征碼的基本原理可以概括為:把漢字的部件按外形特征相對于英文26個字母在音、形、義三方面的一致性劃分成600個左右的基本部件,用這些部件可以構成絕大多數(shù)中文字,并把這些部件按類型列出基本部件表;根據(jù)部件在構字時的位置,按先左后右、先上后下的順序排列成部件序列,如“漢”、“徵”、“霹”三個字的部件序列表示為:漢︱氵又;徵︱彳山一王攵;霹︱雨尸口立十;然后根據(jù)部件的類型,把每個字的部件序列改寫成對應的英文字母序列,漢︱氵又/dv;徵︱彳山一王攵/befiv;霹︱雨尸口立十/trocp,得到的結果就是漢字的編碼(實際應用時這一步可以跳過);把編碼按規(guī)則鍵入電腦。
漢字表征碼唯一要“死記”的就是26種部件類型,其余都可熟能生巧。表征碼從系統(tǒng)工程的角度出發(fā),創(chuàng)立了只有編碼才是整個系統(tǒng)中決定中文信息處理實現(xiàn)四個“化”的環(huán)節(jié);而且只有利用中文的部件才能編出四個“化”的碼來;部件能被用來決定四個“化”的信息只有部件的外形特征;部件的外形特征最簡單、最現(xiàn)實也是最科學的辦法,是參照26個鍵盤字母從音、形、義三方面進行分類等一系列理論問題和方法問題。正是這幾個環(huán)節(jié)環(huán)環(huán)相扣奠定了保證中文信息處理民族化、大眾化、規(guī)范化和國際化的基石。
性能優(yōu)越,意義非凡
華興初介紹說,漢字表征碼的優(yōu)越之處在于,相對于英文單詞一半以上超過8個字母的現(xiàn)象,通用的漢字表征碼碼長一般只需4位,而且獨體字(一個部件就是一個字)和只有兩三個部件的簡單漢字的數(shù)量大體超過總字數(shù)的一半。因此只需取碼長6位就可能使幾十萬漢字避免重碼(當然這樣要求并無絕對的必要)。據(jù)對1.2萬個簡、繁、異體字統(tǒng)計推算,如用6位碼(4位碼的理論容量為47萬,它不可能為數(shù)十萬漢字編出理想的碼來,因為根據(jù)方塊字的特點,絕大多數(shù)碼將輪空,將會造成嚴重的重碼。6位碼的理論容量超過3億,因此,碼長6位可以滿足漢字表征碼的需要),憑現(xiàn)有表征碼技術,即使那些前面有四五個部件相同、最容易發(fā)生重碼的字也不會出現(xiàn)重碼。若今后擴大字庫,產(chǎn)生重碼的概率很低。即使出現(xiàn),解決起來也不難。
另外,漢字表征碼從理論上抓住了編碼這個關鍵性環(huán)節(jié),一舉突破了千百年來公認的中文難題,研究方法使人耳目一新。華興初用一、二、三、四、五、六“六字訣”來概括表征碼的性能:
一是漢字表征碼可以一碼定乾坤,從根本上解決中文走向世界的問題。漢字表征碼有充分的理由向世界宣告:中文永遠不可能西化!
二是漢字表征碼具備中文排序和中文信息處理兩大功能,而且兩者都趕上超過英文。
三是將部件形狀、部件外形特征符號(表征符)、鍵盤字母三者在音、形、義三方面直接對應,使?jié)h字信息處理做到三個一步到位:見字直接翻字典;見字直接敲鍵盤進行中文信息處理,速度比英文快;見字就能正確確定任一個漢字在任何一個規(guī)范化字表或字符集中的位置。
四是漢字表征碼為中文信息處理四大標志性工程的順利完成提供了技術基礎與實現(xiàn)的可能。四大標志性工程是:中文全庫的建成;中文輸入方法全面達到四個“化”;中文信息技術的全面規(guī)范化;中文信息的無障礙輸出/入電腦。四大標志性工程完成之日就是中文現(xiàn)代化、國際化到來之時。有了漢字表征碼,實現(xiàn)這個過程只需5~10年。
五是中文信息處理技術中五個環(huán)節(jié)的五個核心是保證中文信息處理趕超英文的理論基礎。這五個核心是:中文信息處理技術的核心是四個“化”;四個“化”的核心是民族化;民族化的核心是編碼;編碼的核心是漢字的部件;部件的核心是它們的外形特征。這五個環(huán)節(jié)環(huán)環(huán)相扣,保證了漢字表征碼成了名副其實的民族化、大眾化、規(guī)范化、國際化的編碼—真正屬于漢字自己的編碼。
六是漢字表征碼能保證中文信息處理達到六個所有:適用于古、今、中、外、繁、簡所有漢字;所有視力、智力正常的人都能學會、掌握;涵蓋所有漢字信息的應用和管理領域;至少經(jīng)得起東漢說文解字以來漢字發(fā)展的所有時空的檢驗(含將來中文字庫的“無限”擴展與創(chuàng)新);具有所有漢字編碼的優(yōu)點;尚未發(fā)現(xiàn)以往所有漢字編碼存在的缺點。
華興初介紹說,表征碼幾乎不需要規(guī)則,基本不需采取什么技術措施,就能見字敲鍵盤,進行中文信息處理。據(jù)以8300個通用“規(guī)范”漢字及其繁體字、異體字約12 000字進行統(tǒng)計,平均碼長為3.5左右。對規(guī)范說明部分關于簡繁體關系一段論述編碼結果達到52%的漢字沒有重碼,36%漢字的重碼字數(shù)為2~5個,10%漢字的重碼字數(shù)為6~10個,只有不到2%漢字的重碼字數(shù)在10個以上(總字數(shù)約230個),這樣的性能對于絕大多數(shù)用戶和漢語基礎較差的娃娃與外國人使用起來,足夠滿足幾輩子的需要!
傳承文明,助圓“文化強國夢”
漢字表征碼不僅僅是中文信息輸入方法的一個創(chuàng)新,是對漢字和部件的認識方法和利用的創(chuàng)新,而且是IT革命從低級到高級的一次根本性跨越,是民族文化與西洋文化的兩種認知概念的巧妙融合,表征碼的計算機漢字輸入法把中西方文化的認識差異在現(xiàn)代技術的結合點—電腦鍵盤上一“鍵”勾銷,中文趕超英文,中文進入世界就會從理想變成現(xiàn)實。
中文信息處理技術的全面突破其意義不僅在于中文信息處理本身,而且還可以在教學上徹底決中文基礎教育的難題,建立起一個“以漢字為本、以部件為核心、以拼音為工具的漢字學習、漢字查檢、漢字信息處理三位一體的規(guī)范、優(yōu)質(zhì)、高效、減負的新穎漢語基礎教學體系”;在經(jīng)濟上可以把中文信息處理技術與產(chǎn)品從現(xiàn)在的只有國內(nèi)的有限范圍擴大到全世界各個角落,中文電腦就與英文電腦沒有差別,其對國民經(jīng)濟的拉動作用將是以往的幾倍!更重要的是政治上可使我國有條件建立一套中文獨立的信息處理系統(tǒng),擺脫英文互聯(lián)網(wǎng)對中文信息交流的控制,確保我國網(wǎng)絡安全甚至國家安全,意義深遠,非同一般。
華興初表示,有了中文信息處理技術和漢字表征碼,中文將再開創(chuàng)一個向現(xiàn)代化、國際化大踏步邁進的新的輝煌歷程,并最終將與英文一樣成為又一個國際化的語言與文字。對提高我國的文化軟實力,提升我國國際地位,建設文化強國具有極大的意義。