邵澤國
(1.上海師范大學人文傳播學院,上海 200234;2.上海電子信息職業(yè)技術(shù)學院院長辦公室,上海 201411)
“漢語方言地理信息系統(tǒng)平臺建設”是由潘悟云先生主持的一項教育部哲學社會科學研究重大課題攻關(guān)項目,該系統(tǒng)“以地理空間數(shù)據(jù)庫(Geographical Database)和方言數(shù)據(jù)庫(Dialectical Database)為基礎,通過程序?qū)Ψ窖詳?shù)據(jù)庫進行處理,真正實現(xiàn)自動提取方言特征,自動繪制語言地圖,真正成為方言地理研究和語言政策制定服務的方言地理信息系統(tǒng)(Geographical Information System of Dialect)[1-6]”。
眾所周知,分類是人類認識客觀世界的一種基本的方法。人類最初對事物的命名就是一種分類活動。從科學研究的角度說,之所以要研究一種事物,目的是為了認識這種事物,以便可以能動地駕馭和利用這種事物,使之為人類服務。而所要認識、研究的事物往往是紛繁復雜的,群體中的個體從外形到屬性,千差萬別,各不相同。可以這樣說,世界上找不到完全相同的兩個個體。因此,要研究、認識事物,必須對所研究的事物進行分類,沒有分類就沒有科學[7]。
對語言的研究、分析、比較,特別是要將語言特征在電子地圖上直觀地描繪出來,往往要按照一定規(guī)則對語言進行分類。而文中所要討論的語言分類系統(tǒng)是漢語方言地理信息系統(tǒng)的一個子系統(tǒng),它可以幫助語言研究者對語言進行有效、快速的分類。
在漢語方言地理信息系統(tǒng)中,語言特征提取子系統(tǒng)按照用戶設置的條件自動提取出各個語言點的語言特征數(shù)據(jù)。此時的語言特征數(shù)據(jù)往往是一個個數(shù)據(jù)集。一般來講,不會用原始的數(shù)據(jù)集來作為待分配項,而是將數(shù)據(jù)集交給特征主體層提取子系統(tǒng),得到的主體層數(shù)據(jù)歸并后作為待分配項。分類系統(tǒng)通過系統(tǒng)預設的分類規(guī)則或用戶自設的分類規(guī)則自動完成對待分配項進行分類。得到兩級三層的分類信息,再加上語言點的地理坐標值一并提交給地理信息系統(tǒng)(Geographic Information System,GIS),以供GIS處理后畫出語言分類地圖。
圖1 分類系統(tǒng)功能流程圖
系統(tǒng)前臺使用Microsoft Visual Studio 2008 C#語言,后臺使用Microsoft SQL Server2008系統(tǒng)。
由于之前已經(jīng)完成了漢語方言地理信息系統(tǒng)的數(shù)據(jù)庫設計,所以這里的DB設計只是涉及到與分類系統(tǒng)相關(guān)的幾個數(shù)據(jù)表設計。
2.1.1 主體層特征表lf_mf
該表用來存儲主體層提取的結(jié)果。在該表上歸并mf指段,取唯一值作為待分配項,寫入表tb_clas的cf字段。
表1 lf_mf表結(jié)構(gòu)
2.1.2 分類數(shù)據(jù)表lf_clas
該表中id字段由“0”開始每寫入一個cf的值自動加1,字段c1id、c2id的所有值在分類操作前初始化為“00”。字段 ph_type存儲分類的結(jié)果,其值形如“02-01-01”圖標編號。
表2 lf_clas表結(jié)構(gòu)
2.1.3 特征規(guī)則表lf_ftype
四是著力加強風險管控。統(tǒng)一組織對大隊進行內(nèi)控制度執(zhí)行情況審計,平時不定期進行抽樣審計和專項審計,加強農(nóng)業(yè)生產(chǎn)風險管控和防范。嚴格執(zhí)行《蘇墾農(nóng)發(fā)內(nèi)控制度手冊》,建立健全農(nóng)業(yè)生產(chǎn)經(jīng)營管理責任追溯追究制度。
在自定義分類時系統(tǒng)提供了“條件分類”的快捷方法,即對待分配項按條件自動選擇。過濾條件存儲在特征規(guī)則表lf_ftype中。特征類型指的是語音的發(fā)音方法、發(fā)音部位或發(fā)聲態(tài)等。如聲母特征類型有:鼻音、邊近音、邊閃音、不送氣、擦音、顫音、次清、次濁、近音、清音、全清、全濁、塞擦音、塞音、閃音、送氣、響音、濁音、阻音。sql字段中的SQL語句是生成對應的特征類型在元數(shù)據(jù)表中對應的標記。
表3 lf_ftype表結(jié)構(gòu)
通過用戶界面用戶可以對待分配項劃分為兩級3層,即對待分配項可分為兩個級別,大類和小類;同時為繪制地圖提供顏色、圖例、圖標3層標識信息。
A、B、C為ListBox控件;A用于接收和顯示待分配項數(shù)據(jù);B(從左向右分別稱為B1、B2)用來接收和顯示分類命名數(shù)據(jù);B1用顏色表示;B2用圖例表示;C(從左向右分別稱為C1、C2)用來接收和顯示對應類別下的已分配項數(shù)據(jù)。
D為TextBox控件,用于接收和顯示分類結(jié)果數(shù)據(jù)。
E、F、G、H為Button控件;E為添加分類名;F為刪除分類名;G為添加分配項;H為移除已分配項。
I、J為DropDownList控件。I(從左向右分別稱為I1、I2)靜態(tài)獲取Items,第一個為顏色選擇序列:褐色、藍色、紅色、綠色、粉色、黑色;第二個為圖例選擇序列:實心、空心、上實下空、上空下實、左實右空、左空右實、中心實點。
K均為Button控件,“取消”為取消之前所有分類操作,并清空控件B、C、D的顯示信息,同時改寫表lf_clas。“確定”將分類結(jié)果數(shù)據(jù)寫入到表lf_clas,并傳值給GIS系統(tǒng)?!胺祷亍睘榉祷氐健胺窖蕴卣魈崛 表撁妗?/p>
這里僅介紹功能實現(xiàn)的幾個核心函數(shù)。
2.3.1 分類命名函數(shù)
控件E調(diào)用。其功能是將用戶選擇的dr1中的項(text)寫入lb2,清除當前l(fā)b1的所有項。如做一級分類時,將用戶選中的控件I1中的項(褐色、藍色、紅色、綠色、粉色、黑色之一)寫入B1,清除C1的內(nèi)容。
2.3.2 刪除分類名函數(shù)
控件F調(diào)用,其功能是刪除一個已經(jīng)分配的類(大類或小類)。用戶選擇lb1(對應控件B)一些項,系統(tǒng)將lb1中選中的項清除,并將清除項(作為類名)下的所有分配項從lb3(對應控件C)移入到lb2(C1或A)。如果該分類名下有子類,同時刪除子類名(嵌套調(diào)用delname)。一個lb1的項的value對應一個cid,這時將數(shù)據(jù)表lf_clas中值為cid的c1id(或c2id)初始化為“00”。
2.3.3 添加分類項函數(shù)
控件G調(diào)用,用戶先選中l(wèi)b1中的某一項(對應控件B),再選擇lb2(對應控件A或C1)中的一些項,系統(tǒng)將lb2中選中的分配項移入lb3(對應控件C1或C2)中,這些分配項歸為一類,用lb1的選中項命名。同時對數(shù)據(jù)表lf_clas的操作是將cf與lb2選中項匹配的記錄的c1id(或c2id)字段值改為lb1的選中項的值。
2.3.4 移出分類項函數(shù)
控件H調(diào)用,用戶選擇lb1(對應控件C)中的某些項,系統(tǒng)將選中項移入到lb2中(對應控件C1或A)。如選中項中包含一個類下的所有項,則調(diào)用函數(shù)delname將這個類名刪除。對數(shù)據(jù)表lf_clas的操作是將cf與lb1選中項匹配的記錄的c1id(或c2id)字段初始化。
2.3.5 條件分類函數(shù)
用戶選擇lb1(對應控件J)中的某一項,其值與數(shù)據(jù)表lf_ftype中的type字段匹配,得到相應的SQL字段的值,即一個SQL語句,系統(tǒng)執(zhí)行SQL得到一個數(shù)據(jù)集,讓后經(jīng)lb2(對應控件A或C1)中出現(xiàn)在這個數(shù)據(jù)集中的項標志為選中狀態(tài)。
從系統(tǒng)的處理機制看,除了系統(tǒng)開始運行時要裝載待分配項數(shù)據(jù)和分類完成后要輸出分類結(jié)果,這兩個動作要訪問數(shù)據(jù)庫,其中間運行過程可以避免系統(tǒng)對數(shù)據(jù)庫的寫操作。所以用一個DataTable實例來存儲據(jù)表lf_clas,同時該系統(tǒng)與其他系統(tǒng)間數(shù)據(jù)集的傳送借助session實現(xiàn)。
[1]JOHN C.Introducing speech and langwage processing[M].北京:北京大學出版社,2010.
[2]曹志耘.漢語方言地圖集[M].上海:商務印書館,2008.
[3]CHRISTIAN N.Professional C#(programmer to programmer)[M].北京:清華大學出版社,2010.
[4]郭鄭州.SQL Server 2008完全學習手冊[M].北京:清華大學出版社,2011.
[5]陸儉明.現(xiàn)代漢語語法研究教程[M].北京:北京大學出版社,2003.
[6]潘悟云.教育部哲學社會科學研究重大課題攻關(guān)項目投標評審書[R].上海:上海師范大學,2009.
[7]林燾.語音學教程[M].北京:北京大學出版社,1992.
[8]PETER L.語音學教程(A course in phonetics)[M].張維佳,譯.北京:北京大學出版社,2011.
[9]朱曉農(nóng).語音學[M].上海:商務印書館,2010.
[10]趙秀怡,熊慶文,涂建光.GIS應用數(shù)據(jù)庫設計二階分析模式[J].武漢大學學報:信息科學版,2003,28(1):98 -101.
[11]雷特.SQL Server 2008 DBA 入門經(jīng)典[M].張德群,譯.北京:清華大學出版社,2010.