【摘要】XML作為一種國際化的通用標記語言,廣泛應用于IT產業(yè)的各個領域。數(shù)據(jù)交換是XML的重要應用之一,平臺間的接口就常采用它來實現(xiàn)。數(shù)據(jù)接口一般都較為穩(wěn)定,但也不盡然。本文就是為了應對XML接口格式的頻繁變化,探索并提出了一種全新的解決方案,設計和研發(fā)了基于數(shù)據(jù)庫的XML腳本及其實現(xiàn)引擎。該引擎已通過了北京同方衛(wèi)康科技有限公司的測試,應用于實踐。
【關鍵詞】XMLScript數(shù)據(jù)交換語法分析器語法解析器棧
一、引言
XML是由W3C組織于1998年2月制定的一種通用語言規(guī)范。XML是SGML(標準通用標記語言)的一個子集,其最大優(yōu)點在于適合網上發(fā)布和數(shù)據(jù)交換[1]。XML是目前全球范圍內描述數(shù)據(jù)和交換數(shù)據(jù)的一種標準的方式。XML作為平臺接口,一般數(shù)據(jù)格式都比較穩(wěn)定,可以用多種技術和方式來實現(xiàn)它;但當數(shù)據(jù)格式變動比較頻繁的情況下,每次數(shù)據(jù)格式的微小變化都必須修改源代碼。本文就是以北京同方衛(wèi)康科技有限公司面對北京市衛(wèi)生局統(tǒng)計平臺接口的變化為契機,提出了一種應對這種變化的通用解決方案。
二、Xml腳本引擎的設計原理
2.1XML通用設計接口
作為一種數(shù)據(jù)交換的中間件,XML具有跨平臺、結構化和子描述性強的特點[2]。因此,常用XML作為系統(tǒng)和平臺間的數(shù)據(jù)接口。設計師們通過分析數(shù)據(jù)接口的格式,從數(shù)據(jù)庫或者基于數(shù)據(jù)庫的數(shù)據(jù)層中產生這些數(shù)據(jù)。圖1簡單描述了這種通用性XML的生成過程。
2.2XML腳本引擎工作流程
由通用XML生成流程圖易見,如XML數(shù)據(jù)格式變化比較頻繁,哪怕只有一個微小的改動,也得修改代碼。本文設計的基于數(shù)據(jù)庫的XML腳本引擎,一般情況下,只需通過更新XML模板文件就能夠應對這種變化;而此引擎可以作為Active DLL或者基層類庫來使用。圖2,展示了該引擎的工作流程圖。
三、XML腳本引擎設計與實現(xiàn)
3.1XML腳本
在XML示例文件基礎上添加一些自定義語法規(guī)則信息,我們把這些符合一定規(guī)范的附加信息叫做XML腳本(XMLScript)。
XMLScript規(guī)則制定如下:(1)腳本位置。(a)置于注釋節(jié)點中;(b)置于無實際功用的描述性屬性中;(c)置于Element的Text文本值中;(2)變量信息定義。(a)單變量格式:{@變量名:變量值}。(b)多變量格式:{@變量名1:變量值1;@變量名2:變量值2};(3)執(zhí)行語句:(a)Sql執(zhí)行語句:{@fSQL:@數(shù)據(jù)庫連接變量,@r記錄集變量,@Sql語句變量[;@變量|@r其他已打開記錄集.字段]*};(b)刪除空節(jié)點:{@fDelNullNode:true | 1};(c)循環(huán)節(jié)點:{@fLOOP1:記錄集};(d)自定義函數(shù):{@f函數(shù)名:[變量]}。
3.2XMLScript模板
我們稱加入了XMLScript的XML文件為XMLScript模板,即XMLScript Template。模板示例如下:
注:本示例中所采用的SQL語句是同方的工程師們在研究SQL SERVER優(yōu)化機制后采用的優(yōu)化形式,其功效與參數(shù)化查詢不相上下,但要簡練得多。
3.3XML腳本引擎
我們把通過解析和解釋XMLScript模板,自動從數(shù)據(jù)庫中獲取指定數(shù)據(jù)的軟件體系稱為XML腳本引擎(DBToXMLScript Engine)。
鑒于XML的層級特點和腳本定義的語法規(guī)則,該引擎采用棧作為主存儲結構。引擎加載XMLScript模板后,語法分析器逐次遍歷各節(jié)點,從節(jié)點信息中提取出腳本信息,再交由語法解釋器處理。該引擎采用的是邊解釋邊執(zhí)行的方式,故可視為解釋型引擎,具體設計架構如圖3所示。
(1)語法分析器(Parser)
語法分析器,用于分析XML模板文件,循環(huán)遍歷各節(jié)點,提取出XMLScript,再把這些腳本信息交由語法解析器來處理。
(2)語法解釋器(Interpreter)
語法解釋器,把分析器推送過來的語法信息分類,參照該層次XML節(jié)點依次把腳本和節(jié)點信息放入不同的棧中,并依次執(zhí)行“執(zhí)行語句”,生成目標XML文件。
執(zhí)行期間,還需記錄操作日志、刪除空節(jié)點、刪除屬性信息等。記錄操作日志,可以協(xié)助調試和發(fā)現(xiàn)錯誤信息;刪除空節(jié)點可以刪除一些無用的記錄;刪除屬性信息,可以減小XML文件的大小。這幾項操作被設置為了可選項,但它們在開發(fā)和應用中往往是必不可少的。
除已定義好的函數(shù)外,該引擎還允許它的用戶(客戶端)重載自定義函數(shù),來對從數(shù)據(jù)庫中得到的數(shù)據(jù)進行加工,以滿足最終平臺的要求。如示例模板中的{@fDICT_GENDER:@r病人基本信息.GENDERID},由于客戶醫(yī)院的性別字典ID值與衛(wèi)生局平臺不一致,因此需要一個重載的函數(shù)DICT_GENDER來實現(xiàn)。
(3)棧(Stack)
按XMLScript包含的信息,??杀环譃槿悾撼A織?、命令棧、記錄集棧。常量變量信息都存儲為常量;命令棧,用于存儲可執(zhí)行語句信息;記錄集棧,用于存儲數(shù)據(jù)庫查詢操作返回的記錄集。
XMLScript的變量采用棧作為存儲結構,因此腳本的位置決定了其所在的作用域,就如同程序變量一樣。首先,位于XML根節(jié)點之前的Script,其中的變量信息可被視為全局變量,最先入棧卻最后出棧;再者,位于各節(jié)點間和節(jié)點屬性內的Script,其中的變量信息也依次入棧,同時還必須增加輔助標記,以在該節(jié)點訪問完畢后釋放該節(jié)點內的變量。
3.4引擎測試與驗證
該引擎只對外公開了幾個屬性和三個方法,但卻可以完成復雜的功能。事實上,只有加載XML模板文件Load方法和保存SaveAs方法才是必須的,UserFunction方法用來擴展自定義函數(shù),實現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)的二次處理,只有必要時才重載。
該引擎易于使用,核心測試代碼如下:
DBToXML engine =new DBToXML( );
engine.Load(@“C:\template.xml”);
engine.SaveAs(@”C:\result.xml”);
運行結果如圖4所示。
四、結束語
本文設計和開發(fā)了基于數(shù)據(jù)庫的XML腳本及其引擎,將XML接口的易變性封裝在了XML腳本模板中,只需更新模板文件就能應對接口的變化,極大的提高了開發(fā)人員的工作效率。由于該引擎直接操作數(shù)據(jù)庫勢必會造成性能損失,不適用于對實時性要求較高的系統(tǒng)。另外,SQL語句置于模板文件,模板位置可能直接影響公司數(shù)據(jù)安全,對安全性要求較高的用戶需增加防護策略。
參考文獻
[1]王仲,陳曉鷗.基于XML的數(shù)據(jù)交換與存取技術研究.計算機工程與應用,2001,24:108-111
[2]孫君明,郭紅.基于XML的異構信息交換技術研究[J].計算機應用研究,2003,20(1):72-73