黃山 易法令
摘要:代謝綜合征及其并發(fā)癥是十分普遍的慢性疾病,我國患病人數(shù)持續(xù)攀升,對其相關的研究已成為中西醫(yī)學者研究的熱點。代謝綜合征文獻系統(tǒng)數(shù)據(jù)庫以該領域的大量文獻為基礎,通過對相關文獻資料進行系統(tǒng)的整理,按照文獻特征進行分類,提取出各類文獻中的有效信息,將文獻中非結構化的數(shù)據(jù)轉(zhuǎn)換成了結構化的數(shù)據(jù)庫。該數(shù)據(jù)庫的設計為代謝綜合征文獻的綜合應用及數(shù)據(jù)挖掘奠定了基礎,使相關的科研和臨床的文獻研究更為便捷。
關鍵詞:數(shù)據(jù)庫;代謝綜合征;文獻系統(tǒng); 設計
中圖分類號:G250.74 文獻標識碼:A 文章編號:1009-3044(2016)23-0003-04
Abstract: The prevalence of metabolic syndrome and its complications are very common in chronic diseases. The population of illnesses in our country is increasing. The research on it has become a hot spot in the research of Chinese and Western medicine. Metabolic syndrome literature database system to the field of a large number of documents as the basis, through the collation of relevant literature, according to the characteristics of literature classification, extract the effective information of all kinds of literature, literature in non structured data are transformed into the structure of the database. The design of the database has laid a foundation for the comprehensive application and data mining of the metabolic syndrome, which makes it more convenient for the related scientific research and clinical literature research.
Key words: database; metabolic syndrome; literature system; design
代謝綜合征(Metabolic Syndrome,MS),是心血管病的多種代謝危險因素在個體內(nèi)集結的狀態(tài),主要包括胰島素抵抗(IR)、腹型肥胖、糖耐量受損(IGT)、血脂異常以及高血壓[1]。目前,本病在世界范圍內(nèi)呈流行趨勢[2],在我國人群的發(fā)病率也呈逐年上升趨勢,2009年開展的流行病學調(diào)查顯示,國代謝綜合征發(fā)病率大于15%,患者人數(shù)已超過2億,其中18歲以上人群中患病率為10.5%[3],兒童青少年的患病率達3.2%[4]。代謝綜合征的防治日益受到關注,已成為中西醫(yī)學者研究的熱點 。然而,目前代謝綜合征文獻數(shù)量繁多、內(nèi)容雜亂、質(zhì)量不齊,并且不斷更新,這給代謝綜合征臨床治療和科研研究帶來諸多不便,因此,有必要對這些資料進行系統(tǒng)的整理。本研究旨在通過建立現(xiàn)代代謝綜合征文獻數(shù)據(jù)庫,進行國內(nèi)外有關代謝綜合征文獻的回顧總結,對這些文獻資料進行系統(tǒng)的整理,根據(jù)文獻特征進行分類,提取出各類文獻中的有效信息,完成代謝綜合征文獻數(shù)據(jù)的搜錄以及安全儲存,實現(xiàn)代謝綜合征文獻內(nèi)容的數(shù)據(jù)化轉(zhuǎn)換,為代謝綜合征文獻質(zhì)量評價及數(shù)據(jù)挖掘奠定基礎,用于發(fā)現(xiàn)代謝綜合征病理、影響因素及和療效的相關性等規(guī)律,以指導科研和臨床。
1 文獻資料采集
1.1 文獻檢索
中文檢索詞設置為“代謝綜合征”或“糖代謝”或“脂代謝”等, 時間年限設置為2005年-2016年,檢索范圍為中國知網(wǎng)全文期刊數(shù)據(jù)庫(CNKI)、 萬方數(shù)據(jù)知識服務平臺、維普中文科技期刊數(shù)據(jù)庫(VIP)、中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)。英文檢索中,使用主題詞“Metabolic Syndrome X”進行檢索,時間年限設置為2005年-2016年,檢索范圍為Pubmed文獻數(shù)據(jù)庫。結果:共檢索出代謝綜合征得中文文獻16,512篇,英文文獻22948篇。
1.2 文獻納入排除標準
語言類型為漢語類文獻或英語類文獻,已正式發(fā)表的期刊文獻以及博碩士畢業(yè)論文中以描述代謝綜合征治療為主要研究內(nèi)容的所有文獻。
排除標準:實驗對象為動物、尸體類文獻;文摘類文獻;解疑類文獻;重復發(fā)表的文獻;報紙報道類文章;內(nèi)容中有明顯錯誤的文獻;英語類文獻排除來自中國境內(nèi)的只收錄摘要的文獻。
1.3 文獻資料分類
在建立數(shù)據(jù)庫之前,務必要對收集到的文獻進行分類。在完成最終納入代謝綜合征文獻的閱讀后,將文獻分為5類,分類及標準如下:
1)臨床治療類——以探討代謝綜合征與某種方式治療效果關系為目的, 受試者為該疾病患者或健康人,治療組為藥物治療組等的試驗類文獻。其文獻類型特征:內(nèi)容上研究通過藥物治療、物理方法治療,并評價治療效果。研究方法上有:服用藥物雙盲對照、手術等。藥物包含:阿卡波糖、二甲雙胍等西藥以及其他中藥。評價指標包含:。關鍵詞中含有:藥物名稱、臨床治療、臨床療效等。
2)機理試驗類——以研究代謝綜合征,受試者為健康人或某類疾病患者,試驗組為控制條件后的樣本等試驗類文獻。其文獻類型特征:研究機理指標的改變。研究方法上有主要以實驗室研究為主。涉及的指標多數(shù)為:血生化指標,探測不同病理時期以及合并并發(fā)癥時的生理指標變化。關鍵詞中包含:生化指標、病理變化、異常指標等。
3)流行病學類——以研究代謝綜合征疾病分布及其決定因素為內(nèi)容的文獻。其文獻類型特征:以調(diào)查疾病的患病率、死亡率、危險因素等為目的;方法上以問卷調(diào)查、體格檢查和實驗室檢查為主;涉及的指標:患病率、發(fā)病率、死亡率、超重率、血脂異常率、高血壓異常率、糖尿病異常率等;關鍵詞中含有流行病學、現(xiàn)況調(diào)查、隊列研究、病例對照研究、橫斷面研究、患病率、發(fā)病率、死亡率等。
4)健康管理類——以慢性病的三級預防、健康管理干預,評價干預效果為主要內(nèi)容的文獻。其文獻類型特征:干預方式包括健康教育、飲食治療、有氧運動、藥物應用指導、定時檢測、生活方式和行為等護理干預,改變生活方式、藥物治療等綜合干預;涉及的生化指標有:空腹血糖、血甘油三脂、總膽固醇、體重指數(shù)、收縮壓與舒。張壓等指標;涉及的評價指標有:干預后治療率、知曉率、控制率;關鍵詞中含有、健康管理、健康跟蹤管理、防治、護理干預、生活方式、效果評價等。
5)綜合文獻類——包括綜述類文獻、 回顧性文獻。其文獻類型特征:無法歸類,但是對總結,重要性高,在數(shù)據(jù)庫設計中僅以文獻基本信息、文獻分類信息及全文的方式存儲。關鍵詞中含有:展望、進展、回顧、綜述等。
2 數(shù)據(jù)庫設計
2.1 具體設計
根據(jù)上述指標分類,構建總體的評價數(shù)據(jù)庫,在數(shù)據(jù)庫設計過程中,要將不同類型文獻對應的研究方法指標、研究結果指標分開,文獻分類信息中包括:文獻關鍵詞判斷、文獻標題判斷等基本信息,按照研究結果指標分類要求分為三類:治療結果指標、調(diào)查結果指標、相關因素指標;按照研究方法指標分類要求分為四類:分組指標、實驗室檢查指標、體格檢查指標、問卷調(diào)查指標。
圖1為整個數(shù)據(jù)庫的E -R圖,在E-R圖中定義了12個實體,其中:“文獻基本信息”實體包括了文獻的中文標題、英文標題、作者、作者單位、期刊名稱、中文關鍵詞、英文關鍵詞、分類號、文章編號、基金項目、中文摘要和英文摘要;“研究對象”實體的屬性包括選擇時間、入選標準、排除標準、診斷標準、地區(qū)名稱、分組方法、抽樣方法、總抽取人數(shù)、有效例數(shù)(男)、有效例數(shù)(女)、總平均年齡、平均年齡(男)、平均年齡(女)、最高年齡(男)、最高年齡(女)、最低年齡(男)、最低年齡(女)、應答率、平均病程(男)、平均病程(女)。
各個實體對應的關系:“代謝綜合征文獻基本信息”與“文獻分類信息”是n:1的關系?!把芯繉ο蟆笔撬屑{入文獻共同存在的部分,部分屬性允許為空,與“文獻分類信息”是1:1的關系?!把芯糠椒ā迸c“文獻分類信息”是m:n的關系,即一個文獻分類可能有多個研究方法,同樣一個研究方法可能對應多個文獻分類,“研究方法”具體對應的4個指標實體,分別是“實驗室檢查指標”、“分組指標”、“體格檢查指標”、“問卷調(diào)查指標”,均是1:1關系?!爸委熃Y果指標”、“調(diào)查結果指標”、“相關因素指標”與文獻分類信息是1:1的關系?!把a充指標”是針對個別文獻出現(xiàn)的新指標,需要另行補充,與“文獻分類信息”是1:1的關系。
2.2 系統(tǒng)表設計
根據(jù)數(shù)據(jù)庫E-R模型實體及關系,建立“代謝綜合征文獻表”記錄所有文獻基本信息,各表字段內(nèi)容如表1所示。建立“研究對象表”,各字段內(nèi)容如表2所示。其他實體關聯(lián)的表涉及不同文獻分類,需要具體研究才能確定。
“文獻基本信息”和“研究對象”是上述五類文獻都具有共性的地方,所對應的是表1,表2的內(nèi)容。而到了“研究方法”和“研究結果”的部分,每個類別差異性增加,無法歸為一個表,因此需要針對每個類別總結其文獻類別的內(nèi)在規(guī)律,關聯(lián)到具有各自特質(zhì)的不同的表,下面以“臨床治療類”文獻為例作描述。
經(jīng)過大量閱讀和回顧“臨床治療類”的文獻,發(fā)現(xiàn)其“研究方法”的部分通常對患者進行分組,其中一組使用一種的治療方法,另一組按傳統(tǒng)方法治療或使用另一種方法治療,以此為對照,有時候會超過兩組。治療方法主要有幾類:中藥治療、西藥治療、中藥聯(lián)合西藥治療、藥物治療伴有手術治療。其中藥物這部分以副表的形式關聯(lián)進來,其屬性包括:藥物的類別(中/西)、藥物的名稱、通用名稱、主要成分、用法用量、不良反應、禁忌、注意事項。分組的屬性還有治療的療程、治療后的護理方案和飲食方案。如涉及手術,則手術的名稱、手術方法。在這一步建立臨床治療類研究方法分組表,如表3所示,藥物副表如表4所示。
不同類別文獻的研究結果內(nèi)容也不同,比如“流行病學類”的研究結果屬性包括:地區(qū)、組別、年齡段、調(diào)查人數(shù)、疾病名稱、患病人數(shù)、MS粗患病率%、統(tǒng)計學P等。經(jīng)過大量閱讀和總結,“臨床治療類”的研究結果對應研究方法的分組進行記錄,通過一系列指標評價治療的效果,如表5所示,包含以下屬性:時間(治療前/后),有效例數(shù)、無效例數(shù)、FBG(空腹血糖)、2HPG(餐后2小時血糖)、HbAlC(糖化血紅蛋白)、血脂、體重、膽固醇、TG(甲狀球蛋白)、HDL(高密度脂蛋白)、LDL(低密度脂蛋白)、SBP(收縮壓)、DBP(舒張壓)、BMI(身體質(zhì)量指數(shù))。
3數(shù)據(jù)錄入示例
以錄入蔣永平的《川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動脈粥樣硬化療效觀察》[5]文獻為例。
第一步,先錄入文獻基本信息,涉及的數(shù)據(jù)表如表1所示,數(shù)據(jù)項包括文獻的標題(川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動脈粥樣硬化療效觀察)、作者(蔣永平)、作者單位(甘谷縣人民醫(yī)院)、期刊名稱(西部中醫(yī)藥)、關鍵詞(代謝綜合征;頸動脈粥樣硬化;川丹消斑湯;辛伐他?。?、分類號(R589)、文章編號、基金項目、摘要等信息。
第二步,文獻標題、關鍵詞等信息判斷文獻的分類,將歸入“臨床治療類”、“機理實驗類”、“流行病學類”、“健康管理類”和“綜合文獻類”中的其中一類,在這里經(jīng)過判別歸為“臨床治療類”。
第三步,錄入文獻研究對象,涉及的數(shù)據(jù)表如表2所示。部分內(nèi)容如下表所示:
第四步,錄入“研究方法”,該文獻分類對應的數(shù)據(jù)項如表3、表4字段所示。
第五部,錄入“研究結果”,該文獻分類對應的數(shù)據(jù)項如表5字段所示。
平臺后端系統(tǒng)設計中,使用EasyUi作為一個良好的后端表現(xiàn)層框架,在對數(shù)據(jù)的增、刪、改、查等操作上具有極大的便利性[8-9],“研究方法”部分的文獻數(shù)據(jù)錄入界面效果如圖2所示。
4 結論及展望
通過建立此代謝綜合征文獻數(shù)據(jù)庫,整理巨量的代謝綜合征文獻數(shù)據(jù),并按照分類的特征抽取出有效的信息,以結構化的方式存儲起來,使臨床醫(yī)生、科研工作者閱讀文獻的效率得到極大的提高。由于數(shù)據(jù)庫中的數(shù)據(jù)具有結構化的特點,因此,研究者能夠以數(shù)據(jù)庫內(nèi)各系統(tǒng)表字段為基礎,建立代謝綜合征文獻質(zhì)量評價報告以及對代謝綜合征文獻的大量數(shù)據(jù)進行數(shù)據(jù)分析及挖掘,為后續(xù)科研與臨床工作提供文獻支持,實現(xiàn)代謝綜合征研究的可持續(xù)發(fā)展。
參考文獻:
[1]Paul L.Huang. A xomprehensive definition for metabolic syndrome[J].Disease Models&Mechanisms,2009(2):231-237.
[2]CAMERONA J,SHAWJE,ZIMMETPZ.The metabolic syndrome: prevalence in worldwide populations[J]. Endocrinology and metabolism clinics of North America,2004,33(2) : 351-375.
[3]XI B,HE D,HU Y,et al.Prevalence of metabolic syndrome and its influencing factors among the Chinese adults:the China Health and Nutrition Survey in 2009[J].Preventive Medicine, 2013, 57(6) : 867- 871.
[4]于冬梅,趙麗云,樸建華,等.8省市兒童青少年代謝綜合征流行現(xiàn)況及其主要影響因素[J].中國健康教育,2012,28(6): 431- 433
[5]蔣永平.川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動脈粥樣硬化療效觀察[J].西部中醫(yī)藥,2013(5):100-102.
[6]中華糖尿病雜志編輯部.國際糖尿病聯(lián)盟代謝綜合征全球共識解讀[J].宋秀霞,譯.紀立農(nóng),校.中華糖尿病雜志,2005,13(3):178-18.
[7]華揚.如何提高缺血性腦血管病超聲探測的準確性[J].中華醫(yī)學超聲雜志,2006,3(4):193-195.
[8] XIAO Shuo- bai. Design and Implementation of Web Asynchronous Tree Based on EasyUI[C]. Proceedings of 2011 3rd IEEE International Conference on Information Management and Engineering (ICIME 2011)VOL.06:121-123.
[9]黃培泉.基于.NET與EasyUI的工資查詢系統(tǒng)的設計與實現(xiàn)[ J] .福建電腦, 2013(4):104-106