楊睿娜
【摘 要】在當前日趨發(fā)達的電子商務環(huán)境下,數(shù)據(jù)分析技術迅速發(fā)展,漢字數(shù)據(jù)庫體系結構分析直接關系著中文電子字典數(shù)據(jù)庫生成情況。然而在實際操作中往往由于數(shù)據(jù)庫信息量比較大,數(shù)據(jù)分析結構復雜等因素使工作效率大幅降低。想要解決這一問題,必須實現(xiàn)中文字典數(shù)據(jù)庫生成設計模式。本文通過中文字典數(shù)據(jù)庫系統(tǒng)設計、數(shù)據(jù)庫生成思路、GB2312字庫全集的生成、數(shù)據(jù)庫維護設計、數(shù)據(jù)庫查詢模塊設計、字典表自定義數(shù)據(jù)錄入模塊設計等幾個方面深入探討電子商務時期中文字典數(shù)據(jù)庫的生成方式及提高系統(tǒng)處理效率問題。
【關鍵詞】電子商務;中文字典;數(shù)據(jù)庫;設計探討
1 中文字典數(shù)據(jù)庫系統(tǒng)設計
中文字典數(shù)據(jù)庫系統(tǒng)采用的是典型的Mediated系統(tǒng)集成結構。數(shù)據(jù)集成系統(tǒng)一般主要通過中介模式將各個部分的數(shù)據(jù)源的數(shù)據(jù)集成起來,而整個系統(tǒng)的數(shù)據(jù)仍然存儲在各個局部數(shù)據(jù)源中,通過包裝器對數(shù)據(jù)進行轉換。用戶在利用數(shù)據(jù)庫進行數(shù)據(jù)查詢的過程中能根據(jù)局部數(shù)據(jù)源模式進行一系列的查詢,引入本體層以后,中介器將對用戶的查詢進行分析,提取有效信息進行查詢之后將查詢結果反饋到中介器中重新組合查詢,并對每個數(shù)據(jù)庫進行結果數(shù)據(jù)分析,將符合數(shù)據(jù)可使用要求的信息反饋出現(xiàn),解決數(shù)據(jù)源數(shù)據(jù)更新問題,從而降低系統(tǒng)工作效率。
2 電子商務時期中文字典數(shù)據(jù)庫的生成思路
2.1 數(shù)據(jù)庫生成思路
在電子商務時代,電子字典數(shù)據(jù)庫生成以后,必須將其匯總到總數(shù)據(jù)庫中進行統(tǒng)一的分析。目前,我國數(shù)據(jù)庫技術已經(jīng)相當成熟,下一步的主要進度是將生成的數(shù)據(jù)庫進行進一步的分析和研究,并重視數(shù)據(jù)庫本身的發(fā)展。由于漢字的復雜性,需要大量的手動操作技術,而自動生成的部分數(shù)據(jù),可能會使系統(tǒng)建立生成更加具有效率。一般情況下,在電子詞典中漢字要素包含:簡體字、ID、拼音、聲調、內碼、偏旁、筆劃、注釋以及拼音等,而在電子字典數(shù)據(jù)庫的開發(fā)中,要注意Windows程序開發(fā)難度分析,因為操作系統(tǒng)的提供的應用程序接口直接關系著程序開發(fā)的難易程度。
2.2 GB2312字庫全集的生成
GB2312編碼是我國漢字信息專用編碼,收錄的漢字信息比較多,比如,字母、簡體化漢字等圖形字符,因此,中文字典的漢字收集數(shù)量較龐大,最多可達到6763個漢字收集數(shù)。中文字典字庫中的所有漢字均按照區(qū)位分步法進行分析,可以將它們分為A1-FF區(qū)進而位,然后生成中文字典字庫文件。
3 電子商務時期中文字典數(shù)據(jù)庫生成設計分析
3.1 數(shù)據(jù)庫維護設計
在電子商務環(huán)境發(fā)展下,中文字典的基礎數(shù)據(jù)庫形式為SMART,軟件的核心構成部位即是該軟件中的一個重要字典。在其結構中能夠看出車站代碼和電報略碼均具有唯一性,能夠用于記錄數(shù)據(jù),如果將電報簡碼作為主鍵處理,根據(jù)不同的需求,車站名稱和站名簡稱兩個字段用于顯示和報表;根據(jù)輸入方式的不同,設置不同的輸入碼處理方式,并且將拼音略碼和電報略碼的用于標明字典或其他字典關系,車站等級主要用于標記車站所述范圍,起始有效期和終止有效期主要用于數(shù)據(jù)有局限性的字典。處理這些關鍵技術以外,為了提高字典訪問下來,還要按照站名略碼及車站名稱建立多個索引。字典的維護與一個普通表的形式?jīng)]有太大的區(qū)別,但是SMRAT系統(tǒng)中這種字典一般數(shù)據(jù)數(shù)據(jù)字典,必須有專用軟件進行專門的維護和管理。另外,還要注意基礎字典本身在建立過程中漢字的輸入只能在Windows操作系統(tǒng)提供的中文輸入法中進行。
3.2 數(shù)據(jù)庫查詢模塊設計
在電子商務數(shù)據(jù)分析環(huán)境下,數(shù)據(jù)字典存儲在服務器中,能夠在前臺應用中采用嵌入式SQL語句進行數(shù)據(jù)查詢,這種數(shù)據(jù)查詢功能的實現(xiàn)一般在存儲過程中實現(xiàn)。在數(shù)據(jù)庫生成系統(tǒng)實際應用中采用數(shù)據(jù)緩沖技術實現(xiàn)數(shù)據(jù)查詢。此技術實現(xiàn)的方法首先是在本地設置一個高速數(shù)據(jù)緩沖區(qū),進行數(shù)據(jù)檢索的過程中首先判定數(shù)據(jù)是否在緩沖區(qū),然后根據(jù)具體情況在緩沖區(qū)實施數(shù)據(jù)檢索。這種檢索方法能夠有效減少服務器下端數(shù)據(jù)數(shù)量,提高工作效率。同時能夠減少與服務器的交互次數(shù),改善服務器性能。
3.3 字典表自定義數(shù)據(jù)錄入模塊設計
數(shù)據(jù)錄入模塊的主要設計思路是根據(jù)后臺數(shù)據(jù)維護程序利用字典表進行數(shù)據(jù)錄入程序設計思路的構想,設計實現(xiàn)步驟如下:首先,編寫數(shù)據(jù)字典查詢所用的存儲過程代碼,并在數(shù)據(jù)庫中建立該存儲過程;其次,在窗口設計窗組件中用于顯示查詢結構集,能夠直接選用上面的存儲過程作為數(shù)據(jù)源,并指定用戶輸入碼為被動參數(shù),然后在應用程序界面設置一個名為Sle-station-name的單行編輯器組件用于顯示站名,而后再設計一個名為sle shortcode單行編輯器組件用于輸入站名略碼;而后為事件編寫腳本:dw_dictiotmry retrieve(sle shortcode text);最后,利用自定義的輸入碼進行字段輸入分析。
4 結術語
中文字典在設計的過程中每個屬性都需要手工識別、計算和生成到漢子數(shù)據(jù)庫中,給系統(tǒng)帶來較大的麻煩。而進行較好的數(shù)據(jù)庫生成設計能夠解決數(shù)據(jù)庫生成困難等問題,提高工作效率。本文基于電子商務環(huán)境分析中文字典數(shù)據(jù)庫生成設計,采用數(shù)據(jù)庫生成算法結合其實現(xiàn)方式,得出的中文字典數(shù)據(jù)庫生成設計步驟實施證明這種方法能夠將系統(tǒng)處理效率可達到50%以上。
【參考文獻】
[1]杜根遠,李瑞民,苗放.中文電子字典數(shù)據(jù)庫生成算法研究[J].計算機工程與設計,2009,17:4134-4137.
[2]張弋.PHP站內中文搜索技術的研究與實現(xiàn)[D].上海交通大學,2009.
[3]江山,汪新慶.Visual C#調用DAO向Access數(shù)據(jù)庫寫入字段標題[J].電腦編程技巧與維護,2010,11:44-45+82.
[4]莫祖英,馬費成.數(shù)據(jù)庫信息資源內容質量用戶滿意度模型及實證研究[J].中國圖書館學報,2013,02:85-97.
[5]孟小峰,周龍驤,王珊.數(shù)據(jù)庫技術發(fā)展趨勢[J].軟件學報,2004,12:1822-1836. [6]張黎明.大宗數(shù)據(jù)中數(shù)據(jù)優(yōu)化抽取方法的研究與應用[D].東華大學,2008.
[7]丘志文.基于認知機理的漢字智能造字之漢字基元研究[D].華南理工大學,2008.
[8]羅春麗.錄井數(shù)據(jù)字典管理系統(tǒng)的設計與實現(xiàn)[D].大連海事大學,2010.
[9]崔冬槐.管理信息系統(tǒng)自動生成器的設計與實現(xiàn)[D].哈爾濱工程大學,2002.
[10]薛曉敏,王漢青,薛延學.數(shù)據(jù)字典的設計及應用[J].電腦編程技巧與維護,1995,12:41-43+57.
[責任編輯:王楠]