摘 要:泰語在東南亞地區(qū)應用比較廣泛,同時,泰語作為一種難度適中的語言輸入法,它的研究既能給較簡單的語言輸入法提供完整的解決思路,也能作為更復雜輸入法的基礎(chǔ)和大體的解決思路。
關(guān)鍵詞:泰語;輸入法
中圖分類號:TN929.53;TP391.14
隨著目前手機產(chǎn)品國際化的趨勢,在不同的國家和地區(qū),手機產(chǎn)品的本地化成為產(chǎn)品功能的重要方面,產(chǎn)品本地化的內(nèi)容中,最主要的是產(chǎn)品需求的本地化定制以及實現(xiàn)。
1 泰語基本研究
在泰語輸入法的研究內(nèi)容中,首先需要熟悉泰語基本語法規(guī)則,在此基礎(chǔ)上對這些規(guī)則進行抽象歸類,并整理出合適的邏輯規(guī)則,并依靠計算機的相關(guān)知識,把這些語法規(guī)則映射到可見的輸入和顯示方式上,形成最終手機上的泰語輸入法。
泰語是在泰國周邊廣泛使用的一種語言,泰語的書寫記錄可以追溯到公園13世紀,它來源于巴里(Pali)語,巴里語是一種在用于手寫佛教經(jīng)文的語言。泰語在泰國以外使用的地區(qū)主要有,越南,緬甸等。
泰語語言由輔音,元音,音調(diào)三種語音元素組成。
1.1 輔音
泰語中輔音有44個,其中有兩個由于語言的發(fā)展已經(jīng)不在使用,他們是 和 。
下面先列出這44個輔音字符:
圖1
1.2 元音
泰語中的元音有26個,它們可以放置到輔音字符的上,下,前,后等位置上。但是對于有些元音字符而言,他們可以單獨使用,像輔音字符一樣。下面按照元音字符的位置不同進行分類,分別進行分析介紹。
(1)基本元音字符
這些元音可以單獨使用,這些字符可以放到輔音字符的前面或者后面:
圖2
(2)上部元音字符
這些元音字符位于輔音字符的上面,進行組合顯示:
圖3
(3)下部元音字符
這些元音字符位于輔音字符的下面,進行組合顯示:
圖4
1.3 元音的組合方式
上述均說明了元音在和輔音以及音調(diào)組合的時候的基本組合方式,下面列出的是所有元音固定的組合方式,如下圖所示,圖中 字符表示替代的部分。
圖5
1.4 音調(diào)
在標準泰語中有五種音調(diào),分別為,中調(diào),低調(diào),降調(diào),高調(diào)和升調(diào)。書寫中有四種標識音調(diào)的標號,其中對于降調(diào)可能使用兩種標號的其中一種,所以書寫中的標號并非有對應的五種。音調(diào)標號的位置是位于字符的上面。下面分別列出:
表1
音調(diào)符號
音調(diào)低調(diào)或降調(diào)降調(diào)或高調(diào)高調(diào)升調(diào)
如 和以上四個音調(diào)的組合,如下所示:
圖6
1.5 數(shù)字
泰語中的數(shù)字1-9如下面顯示:
圖7
1.6 泰語單詞的組成
組成泰語時,需要使用到上文列出的各種字符和音調(diào),泰語的組合方式變化很多,組合的情況也比較復雜。
如下先列出一個組合的例子,能夠簡要的說明泰語組合的基本情況
圖8
從上面的情況可以看出,泰語組合時最多占據(jù)四個寬度不同行。這個字符串主要由三個輔音組成,第一個輔音上面同時疊加了元音和符號,第三個輔音也疊加了元音和符號,但是相比第一個輔音組合,其元音位于輔音下方。
1.7 泰語中顯示的特殊情況
(1)正常組合顯示
在正常情況下,疊加后字符的整體寬度不會變化,只是高度會發(fā)生變化,上文已經(jīng)舉例說明,高度上最多占據(jù)四行,如下所示。
圖9
(2)位置的偏移
在泰語中有些音標的位置會隨著不同的組合,其位置會有所變化。比如下面列出的這個音調(diào)就是一個典型的情況,本來應該疊加在第一個輔音的最上面,但是經(jīng)過組合后,移位疊加到第三個輔音上面。
圖10
(3)組合后的變形
對于有些特殊情況,需要泰語字的組合會發(fā)生變形,如下列出四種變形
圖11
2 泰語鍵盤布局
2.1 電腦鍵盤布局
在電腦上安裝泰語輸入法之后,便可以通過鍵盤輸入泰語了。安裝的時候需要設(shè)置區(qū)域設(shè)置以及語言即可。泰語的輸入可通過直接在鍵盤上按鍵以及按住上檔鍵的同時再按其他鍵。使用電腦安裝泰語后,使用文本編輯器如MS Word軟件可以進行泰語的正常輸入輸出,這樣能在手機上實現(xiàn)時的參考和驗證,是很必要的部分,也是一種很有效的方法。
圖12
2.2 手機鍵盤布局
和電腦布局類似,手機的鍵盤的布局和電腦有所不同,目前國際上沒有統(tǒng)一的標準布局方式,一般而言,采取把44個輔音均勻的布局到手機鍵盤的1-9鍵,然后把5個元音復用布局到1-5鍵上,這樣1-5鍵在輸入輔音后,再次輸入則會根據(jù)泰語語法規(guī)則,輸出相應的元音,并進行組合。
3 泰語實現(xiàn)方式
泰語字符的元音,輔音以及音調(diào)標號均有unicode碼值,對于組合出的字符沒有相應的unicode碼。所以對于組合問題的顯示,實現(xiàn)上有兩種方式,第一種是每次只顯示各個部分,但是需要解決組合的字形的整合問題,但是這種方式的缺點在于,對于組合變形的問題需要單另處理,所以如果能實現(xiàn)組合的前提條件下需要確定組合變形出現(xiàn)的概率,目前看來好像出現(xiàn)變形的情況很少,不過還需要進一步驗證。另一種方法是,通過一次顯示整個泰語字符,這樣需要自定義組合泰語的unicode碼值,并且需要有效的搜索算法做支持。這種方式的優(yōu)點在于顯示組合字符的時候,結(jié)構(gòu)布局更合理,其缺點是可擴展行較差。
4 結(jié)束語
本文在研究手機泰語輸入法的基礎(chǔ)上進行討論分析,詳盡了論述要實現(xiàn)泰語輸入法所需要方法以及可行的方式,由于從語言角度來看,泰語屬于較復雜的語言,所以研究泰語對于研究其他較簡單的語言提供了極大的便利和經(jīng)驗,而對于更復雜的語言,比如印地語,也能提供基本的思路,所以本文的研究是值得其他大部分語言輸入法學習的。
參考文獻:
[1]Charmat Atsawaprecha.Computer and Thai language.Landmark Ltd,F(xiàn)ebruary,1992.
[2]Allison Gordon H.Easy Thai:An Introduction to the Thai Language.Charles E,October,1998.
作者單位:中興通訊股份有限公司,西安 710014