亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)于中文拼音輸入法鍵盤字母布局的探究

        2010-06-05 07:07:28黃金文陳斌宏何泳姝陳曉偉林慶文黃曉明
        中文信息學(xué)報(bào) 2010年6期
        關(guān)鍵詞:文本

        黃金文,金 華,王 凡,陳斌宏,何泳姝,陳曉偉,林慶文,黃曉明

        (華南師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,廣東 廣州 510631)

        鍵盤布局設(shè)計(jì)的研究由來已久,在最初階段,鍵盤來源于打字機(jī),而鍵盤鍵位是按照字母順序排列的,但是如果打字過快會出現(xiàn)卡鍵問題,為了解決卡鍵問題, Christopher Latham Sholes發(fā)明了QWERTY鍵盤布局,最大限度限制敲鍵速度。此后由于鍵盤系統(tǒng)相關(guān)硬件的不斷發(fā)展,相繼出現(xiàn)了August Dvorak的DUORAK鍵盤系統(tǒng)和Lillian Malt的MALT鍵盤,兩者都不同程度地提高了工作效率,但由于種種原因,都沒有得到廣泛應(yīng)用。

        現(xiàn)有鍵盤的字母布局都是根據(jù)英文字母的使用情況而設(shè)計(jì)的,這對于漢字拼音快速輸入有一定的阻礙作用,而且其本身的字母布局就是不合理的。本文的主要工作是要找出現(xiàn)用鍵盤對漢字拼音輸入的不合理性,根據(jù)漢字拼音輸入的特殊性和人手功能,設(shè)計(jì)一個能夠使拼音輸入漢字科學(xué)、高效的鍵盤。早期周志農(nóng)先生的《自然碼》鍵盤設(shè)計(jì)使用的是雙拼方案,即每個漢字聲母、韻母用一個字母來表示。漢光碼漢字輸入法鍵盤布局則使用的是形碼,通過字根的統(tǒng)計(jì)和位置的優(yōu)化設(shè)計(jì)一個新的鍵盤布局,而藏文通用鍵盤布局的設(shè)計(jì)也與此類似。本文選用的是全拼方案,全拼方案側(cè)重的是單個字母的統(tǒng)計(jì)數(shù)據(jù)和使用情況,其已經(jīng)包含了大部分雙拼方案中字母的統(tǒng)計(jì)數(shù)據(jù)。因此,本課題具有極其重要的研究意義和現(xiàn)實(shí)意義。

        1 文本資料的采集與統(tǒng)計(jì)

        本文采用對各種題材、體裁的文本資料進(jìn)行隨機(jī)抽樣統(tǒng)計(jì)的方法,以選取的文本資料最大限度地接近我們?nèi)粘J褂玫那闆r為標(biāo)準(zhǔn)。同時為使所選取的文本資料更加全面,本文對最近兩年(2007年、2008年)的電子版文本資料中的日常報(bào)刊新聞材料、文學(xué)著作、學(xué)術(shù)論文三大類進(jìn)行隨機(jī)抽取,并把隨機(jī)抽取部分作為此次研究的文本資料來源。

        第一類,日常報(bào)刊新聞材料。本文選擇政治、經(jīng)濟(jì)、文化、科技、娛樂、體育等與我們?nèi)粘I蠲芮新?lián)系的材料約254.79萬字,占全部文本資料的53.37%。

        第二類,文學(xué)著作。本文選用各種體裁的文學(xué)作品,節(jié)選自長篇小說、中篇小說、戲劇等,以及篇幅完整的短篇小說、散文,并且以白話文為主,約181.88萬字,占全部文本資料的38.10%。

        第三類,學(xué)術(shù)論文。本文選用有關(guān)數(shù)理化、信息、材料、生物、醫(yī)藥等自然科學(xué)及文化、教育、經(jīng)濟(jì)、法律等人文科學(xué)的論文材料約40.75萬字,占全部文本資料的8.54%。

        2 文字與拼音字母的統(tǒng)計(jì)

        2.1 字?jǐn)?shù)統(tǒng)計(jì)

        本文利用第三方軟件對選取的文本資料進(jìn)行統(tǒng)計(jì),所得結(jié)果為:文本總字?jǐn)?shù)為4 774 226個,包括5 690個不同漢字。

        2.2 常用字劃分標(biāo)準(zhǔn)

        本文根據(jù)現(xiàn)有資料和研究成果,采用以下兩點(diǎn)作為常用字的劃分依據(jù):

        (1) 根據(jù)文獻(xiàn)[5],可以利用常用字出現(xiàn)頻率不低于10-5的先驗(yàn)假定,即在十萬文本資料中至少有一次出現(xiàn)機(jī)會,此時若再增大一個數(shù)量級,即選取百萬文本資料,對于本文是適度的。

        (2) 《現(xiàn)代漢語常用字表》中常用字的個數(shù)為2 500個。

        根據(jù)5 690個不同漢字的使用頻數(shù)、頻率的統(tǒng)計(jì)結(jié)果研究發(fā)現(xiàn),頻數(shù)排在第2 869位與排在第 2 870位漢字的使用頻率相差一個數(shù)量級,分別為10-5和10-6,與上述劃分依據(jù)相符,且其在文本資料中的覆蓋率已達(dá)到99.29%,故可判定常用字個數(shù)為2 869,而此數(shù)據(jù)與《現(xiàn)代漢語常用字表》中常用字個數(shù)相近,因此判定成立。因此根據(jù)以上統(tǒng)計(jì)及多方面分析的結(jié)果,本文將使用頻率排在前2 869的漢字劃分為常用字,其余為非常用字。

        2.3 拼音字母統(tǒng)計(jì)

        本文利用第三方軟件及自主開發(fā)的程序,對所選取的文本資料進(jìn)行轉(zhuǎn)換和拆分處理,統(tǒng)計(jì)得出26個字母的使用頻數(shù)、頻率數(shù)據(jù)如表1所示。

        表1 全部字字母使用頻數(shù)頻率表

        由于常用字各字母使用頻率與全部字字母使用頻率相差不大,且其使用頻率的大小排序一致,故后文用到的數(shù)據(jù)以全部字字母使用頻率為準(zhǔn)。

        表2 常用字字字母使用頻數(shù)頻率表

        續(xù)表

        3 有關(guān)名詞的定義

        定義1設(shè)某一個漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長度|a1a2…ai…an|<7,i=1,2,…,n,n∈N+,則ai在某一文本T中出現(xiàn)的次數(shù)稱為ai在T中的使用頻數(shù),又稱工作量。

        定義5設(shè)某一個漢字的拼音為a1a2…ai…an,其中ai∈{a,b,c,…,z},拼音長度|a1a2…an|<7,ai在拼音a1a2…an中的排列序號為K,i=1,2,…,n,K∈N+,n∈N+,若K為奇數(shù),則稱ai出現(xiàn)在奇位置,若K為偶數(shù),則稱ai出現(xiàn)在偶位置。

        4 鍵盤字母排布

        4.1 排布原則

        確定科學(xué)有效的鍵盤字母排布原則,對隨后的字母排布方案的確定具有重要的指導(dǎo)意義,是鍵盤字母排布的關(guān)鍵一環(huán)。根據(jù)大量的文獻(xiàn)資料,國內(nèi)外的實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)結(jié)果,結(jié)合本文所研究的項(xiàng)目的實(shí)際情況,我們確立了如下排布原則:

        (1) 依頻率優(yōu)先原則,頻率高者放在鍵盤中易敲打區(qū)域;

        (2) 根據(jù)理論和實(shí)踐結(jié)果,結(jié)合文獻(xiàn)[3]中的數(shù)據(jù)表(見表3),對于各排,根據(jù)其所能承受的的負(fù)荷量及出現(xiàn)頻率的高低,按中排、上排、下排進(jìn)行排序;

        表3 各手指每分鐘最多連續(xù)敲擊的次數(shù)

        (3) 對于各手及各個手指,根據(jù)其靈活度及所能承擔(dān)的負(fù)荷和出現(xiàn)頻率高低,按食指、中指、無名指、小指排布;

        (4) 根據(jù)工程心理學(xué)實(shí)驗(yàn)數(shù)據(jù),同一手指敲擊鍵盤運(yùn)動的間隔平均為0.09s,同一手的不同手指之間敲擊運(yùn)動的間隔平均為0.03s,不同手的手指之間敲擊運(yùn)動的間隔平均為0.02s,左右手交替敲擊鍵盤的效率高于單手連續(xù)敲擊鍵盤的效率,且此種情況手指更不易疲勞,因此要盡量使敲擊動作在左右手中交替進(jìn)行;

        (5) 避免某一手指負(fù)荷過重。

        4.2 排布過程

        (1) 本文對拼音字母依據(jù)其出現(xiàn)頻率進(jìn)行排序處理,并對總文本資料獲得的拼音字母的相關(guān)數(shù)據(jù)做進(jìn)一步分析。由于拼音字母在奇、偶位置出現(xiàn)的頻數(shù)是判斷交替率的最主要的數(shù)據(jù),因此本文運(yùn)用程序獲得各拼音字母在奇、偶位置出現(xiàn)的頻數(shù)數(shù)據(jù),得出表4。

        表4 各拼音字母在奇偶位置出現(xiàn)頻數(shù)表

        (2) 對拼音字母按其使用頻率的大小先排中排,同排中先排右鍵區(qū),再排左鍵區(qū),對于局部鍵位,依據(jù)前文所述排布原則進(jìn)行最優(yōu)化處理;

        (3) 上排和下排的排布也遵循過程(2);

        (4) 由表4知,26個拼音字母中,16個只出現(xiàn)在奇位置,1個只出現(xiàn)在偶位置,9個在奇偶位置都有出現(xiàn),因此為了提高左右手的交替率,本文把出現(xiàn)在偶位置上的拼音字母盡可能排在同一鍵區(qū),考慮到右鍵區(qū)可排布的鍵位數(shù)少于左鍵區(qū),因此把有出現(xiàn)在偶位置上的拼音字母根據(jù)實(shí)際情況排在右鍵區(qū),即在(3)排布的基礎(chǔ)上作微調(diào);

        微調(diào)后的最終鍵盤字母排布結(jié)果如下:

        圖1 最終鍵盤字母排布圖

        5 鍵盤的測試

        本文重新設(shè)計(jì)鍵盤字母排布的目的,就是為提高拼音輸入法輸入漢字的效率,而漢字輸入的效率在排除輸入法后,最主要的就是敲擊鍵盤的效率,而敲擊鍵盤的效率又主要體現(xiàn)在手指負(fù)荷和敲擊鍵盤速度的合理性、科學(xué)性上。提高敲擊鍵盤的效率核心在于鍵盤的工作量,其次是交替率等指標(biāo)。而工作量中又以動態(tài)工作量這一指標(biāo)最為重要。因此,本文以工作量和交替率來比較新舊鍵盤在使用拼音輸入法情況下輸入漢字效率的高低。

        5.1 新鍵盤的相關(guān)數(shù)據(jù)

        (1) 由于在能夠承受的負(fù)荷上:右手>左手

        理論上右鍵區(qū)的工作量應(yīng)大于左鍵區(qū),但實(shí)際是右鍵區(qū)可排布拼音字母的鍵位數(shù)為11個,左鍵區(qū)為15個,而根據(jù)圖1的排布用程序計(jì)算出的左右鍵區(qū)靜態(tài)工作量由表5、表6表示。

        表5 左右鍵區(qū)靜態(tài)工作量

        表6 左右鍵區(qū)動態(tài)工作量

        因此,在工作量上左鍵區(qū)大于右鍵區(qū)是合理的,但不宜超過太多;

        (2) 用程序計(jì)算出中排上排下排的靜態(tài)和動態(tài)工作量,詳見表7、表8。

        表7 各排靜態(tài)工作量表

        表8 各排動態(tài)工作量表

        因此,在工作量上:中排>上排>下排是合理的;

        (3) 由于各手指工作量的大小直接關(guān)系到我們敲擊鍵盤的效率,為此,本文利用程序計(jì)算出了八個手指的靜態(tài)工作量和動態(tài)工作量,得出表9和表10,同時可見圖2和圖3。

        (4) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 258個,其交替率為:0.748 33。

        表9 八個手指的靜態(tài)工作量

        圖2 各手指靜態(tài)工作量對比圖

        表10 八個手指的動態(tài)工作量

        圖3 各手指動態(tài)工作量對比圖

        5.2 舊鍵盤的相關(guān)數(shù)據(jù)

        (1) 本文利用程序計(jì)算出舊拼音字母排布鍵盤的靜態(tài)動態(tài)工作量,見表11和12,同時可見圖4和圖5。

        表11 舊鍵盤排布靜態(tài)工作量

        圖4 舊鍵盤排布靜態(tài)工作量對比圖

        表12 舊鍵盤排布的動態(tài)工作量

        圖5 舊鍵盤排布的動態(tài)工作量對比圖

        (2) 左右手都放寬條件下總共符合左右手交替進(jìn)行的漢字有4 261個,其交替率為:0.748 858;

        (3) 舊鍵盤的不合理性

        舊鍵盤動態(tài)工作量中,其不合理之處表現(xiàn)為:

        ① 右手負(fù)責(zé)的鍵位數(shù)為11個,左手負(fù)責(zé)的鍵位數(shù)為15個,右鍵區(qū)總工作量為7 969 143,遠(yuǎn)大于左鍵區(qū)的6 407 230;

        ② 右鍵區(qū)右手工作量為4 791 085,左手工作量為1 656 131,兩者之比為2.89,比值過大;

        ③ 右鍵區(qū)小指工作量為54 662,與相同鍵區(qū)的無名指工作量之比為1∶19.55,與左鍵區(qū)小指工作量之比為1∶38.36,比值過于懸殊;

        ④ 左鍵區(qū)小指工作量為2 097 153,大于所在鍵區(qū)其它任一手指的工作量;

        ⑤ 左鍵區(qū)中指工作量為1 792 673,大于食指工作量1 656 131。

        舊鍵盤的靜態(tài)工作量中,其不合理之處與動態(tài)工作量中的①,②,③,④相同。

        5.3 新舊鍵盤的比較

        (1) 右鍵區(qū)中,食指中指無名指小指負(fù)責(zé)的鍵位數(shù)分別是6,2,2,1,因此它們理論上的最大工作量比值為:

        max(食指∶中指)=3∶1

        max(無名指∶中指)=1∶1

        max(無名指∶小指)=2∶1

        左鍵區(qū)中,食指中指無名指小指負(fù)責(zé)的鍵位數(shù)分別是6,3,3,3,因此它們理論上的最大工作量比值為:

        max(食指∶中指)=2∶1

        max(無名指∶中指)=1∶1

        max(小指∶無名指)=1∶1

        從上述分析及前文數(shù)據(jù)可知,新鍵盤符合上述條件,而舊鍵盤則不完全符合。

        (2) 由于食指所能承受的負(fù)荷大于中指的負(fù)荷,則對于總工作量來說,食指大于中指是合理的,但我們以上計(jì)算的只是各手指的顯式工作量,并未計(jì)算手指在各鍵位之間頻繁移動所產(chǎn)生的隱式工作量,而食指由于移動范圍大,其隱式工作量是大于其余各手指的隱式工作量的,因此,右手食指與中指的最大顯式工作量之比max(食指∶中指)應(yīng)遠(yuǎn)小于3∶1,同樣,無名指與小指最大顯式工作量之比max(無名指∶小指)也應(yīng)小于2∶1,而中指所能承受的的負(fù)荷大于無名指的負(fù)荷,則中指與無名指最大顯式工作量之比max(中指∶無名指)應(yīng)大于1∶1。

        對于左手,食指與中指最大顯式工作量之比也應(yīng)小于2∶1,其余手指之間最大顯式工作量之比約為1∶1即為合理。

        從上述分析及前文數(shù)據(jù)可知,新鍵盤符合性較舊鍵盤好。

        (3) 根據(jù)前文數(shù)據(jù),得出新舊鍵盤工作量對比圖,見圖6和圖7。

        圖6 新舊鍵盤靜態(tài)工作量對比圖

        圖7 新舊鍵盤動態(tài)工作量對比圖

        從上述圖表分析可知,舊鍵盤各手指間的工作量與實(shí)際負(fù)荷偏差過大,而新鍵盤工作量與各手指實(shí)際負(fù)荷的符合性則相對較好。

        (4) 雖然新鍵盤左右手都放寬條件下的交替率為:0.748 33,并未高于舊鍵盤的0.748 858,但舊鍵盤的字母排布具有隨機(jī)性,而這種隨機(jī)性使得字母在鍵盤上的分布更均勻,反而可能會使交替率更高。即便如此,新鍵盤左右手都放寬條件下的交替率已經(jīng)達(dá)到比較高的水平了。

        5.4 測試結(jié)論

        從相關(guān)數(shù)據(jù)及圖表分析得知,現(xiàn)用鍵盤在靜態(tài)和動態(tài)工作量方面都未能很好的符合各個手指的實(shí)際可承受負(fù)荷量,左右鍵區(qū)和一部分手指工作量之間的比值過大,而新鍵盤布局依食指、中指、無名指、小指呈線性遞減關(guān)系,較好地符合各手指實(shí)際可承受負(fù)荷量,并且左右手放寬條件下的交替率為0.748 33,已經(jīng)達(dá)到較高水平。

        綜合以上數(shù)據(jù),我們可以確定新的鍵盤字母排布比舊的鍵盤字母排布在使用拼音輸入法輸入漢字方面更為合理。

        [1] 盧亞軍.藏文計(jì)算機(jī)通用鍵盤布局與輸入法研究[J].中文信息學(xué)報(bào),2006, 20(2):78-86.

        [2] 楊道沅,董小國,董紅,陳丹.《自然碼》雙拼鍵盤設(shè)計(jì)合理的研究[J].中文信息學(xué)報(bào),1994, 8(1):1-14.

        [3] 張澤全.漢光碼漢字輸入法的鍵盤分布研究[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2001. 29(3):83-87.

        [4] 湯步洲,王曉龍,王軒,張強(qiáng).語句級漢字拼音輸入技術(shù)評估方法的研究[J].中文信息學(xué)報(bào),2008, 22(5):52-55.

        [5] 北京語言學(xué)院教學(xué)研究所.現(xiàn)代漢語頻率詞典[M].北京.北京語言學(xué)院出版社,1986.6.

        [6] 國家語言文字工作委員會漢字處.現(xiàn)代漢語常用字表[M].北京. 語文出版社,1988.1.

        [7] 楊道沅,李棣.漢字輸入鍵盤設(shè)計(jì)方法的研究——兼論標(biāo)準(zhǔn)漢字雙拼鍵盤的設(shè)計(jì)[J].中文信息學(xué)報(bào),1997, 11(3):1-12.

        [8] 王永民.計(jì)算機(jī)漢字鍵盤設(shè)計(jì)“三原理”——論計(jì)算機(jī)中文鍵盤的設(shè)計(jì),計(jì)算機(jī)學(xué)報(bào),2005, 28(5):870-881.

        猜你喜歡
        文本
        文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
        重點(diǎn):論述類文本閱讀
        重點(diǎn):實(shí)用類文本閱讀
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        作為“文本鏈”的元電影
        在808DA上文本顯示的改善
        “文化傳承與理解”離不開對具體文本的解讀與把握
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        從背景出發(fā)還是從文本出發(fā)
        語文知識(2015年11期)2015-02-28 22:01:59
        免费做爰猛烈吃奶摸视频在线观看 | 蜜桃在线观看免费高清完整版| 在线亚洲日本一区二区| 乱子轮熟睡1区| 一本久久a久久精品亚洲| 偷拍网日本一区二区三区| 国产影片免费一级内射| 99久久无码一区人妻| 日韩亚洲av无码一区二区不卡 | 亚洲av熟女传媒国产一区二区 | 天堂aⅴ无码一区二区三区| 亚洲aⅴ无码日韩av无码网站| 日本免费a一区二区三区| 色综合久久中文字幕综合网| 男女裸交无遮挡啪啪激情试看| 亚洲熟妇无码久久精品疯| 人妻少妇偷人精品久久人妻| 国产高清乱码又大又圆| 无码人妻精品一区二区三区下载| 亚洲不卡电影| 宅男视频一区二区三区在线观看| 免费无码不卡视频在线观看| 久久久久亚洲av无码专区| 日韩久久无码免费看A| 久久亚洲中文字幕乱码| 亚洲色大成网站www久久九九| 日本视频中文字幕一区在线| 国内精品女同一区二区三区| 亚洲国产精品久久久久久无码| 精品无码一区二区三区亚洲桃色| 狠狠色欧美亚洲综合色黑a| 国产精品国产自产拍高清| 亚欧免费无码aⅴ在线观看| 成人区视频| 国产麻豆国精精品久久毛片| 成人麻豆日韩在无码视频| 亚洲va欧美va国产综合| 中文字幕成人精品久久不卡| 国产精品一区二区三久久不卡| 久久中文字幕无码专区| 亚洲性无码av在线|