林 薇,趙 荷,郝怡雯,朱宗萍,饒雅舒,趙海亮,韓國鑫,趙 萱*,廖 婉*
基于Copula函數(shù)研究柴胡-白芍藥對在治療“肝郁血虛”方劑中的劑量相關性
林 薇1,趙 荷2,郝怡雯2,朱宗萍2,饒雅舒2,趙海亮3,韓國鑫3,趙 萱2*,廖 婉2*
1. 成都中醫(yī)藥大學管理學院,四川 成都 611137 2. 成都中醫(yī)藥大學 西南特色中藥資源國家重點實驗室,四川 成都 611137 3. 成都中醫(yī)藥大學基礎醫(yī)學院,四川 成都 611137
構建Copula函數(shù),研究柴胡-白芍藥對在治療“肝郁血虛”方劑中的劑量相關性。從自建方劑數(shù)據庫中收集治療“肝郁血虛”證并含柴胡-白芍藥對的傳統(tǒng)中醫(yī)方劑,對其中柴胡劑量和白芍劑量進行數(shù)據處理和檢驗,從阿基米德Copula函數(shù)族、橢圓Copula函數(shù)族中選擇出最佳的Copula函數(shù)建立數(shù)學模型,描繪聯(lián)合分布函數(shù)圖,測算Kendal秩相關系數(shù)和Spearman秩相關系數(shù),監(jiān)測柴胡劑量和白芍劑量數(shù)據間的相關性。篩選出109首方劑。Gaussian Copula函數(shù)模型能較好地反映柴胡和白芍劑量之間的相關性,柴胡和白芍的劑量的Kendal秩相關系數(shù)為0.330 1,Spearman秩相關系數(shù)為0.471 8,說明柴胡和白芍劑量之間具有較強的非線性關系,且呈正相關,即隨著其中一味藥劑量增大,另一味藥也傾向于增大劑量。從數(shù)據挖掘和數(shù)理統(tǒng)計角度,創(chuàng)新引入Copula函數(shù)模型,研究藥對劑量的相關性,為傳統(tǒng)經典藥對相使為用提供證據,以及為傳統(tǒng)醫(yī)學臨床用藥提供新的研究思路。
柴胡-白芍藥對;肝郁血虛;Copula函數(shù);劑量相關性;數(shù)據挖掘
柴胡與白芍是常用中藥藥對,最早記載于《太平惠民和劑局方》,臨床應用已有上千年歷史,“逍遙散”“四逆散”“柴胡舒肝散”等經典方均應用此藥對[1]。柴胡與白芍配伍有疏表達邪、疏肝養(yǎng)肝、疏調氣血、升陽散火之功?,F(xiàn)代研究表明,柴胡-白芍藥對協(xié)同使用在抗驚厥、抗炎、抗肝損傷等方面具有顯著療效[2]。中醫(yī)素有“不傳之秘在于量”的說法,在中藥組方配伍研究中,劑量對于療效至關重要,不同劑量的藥物配伍可能產生差異性較大的結果。柴胡-白芍藥對在歷代醫(yī)家的組方用藥中運用較多,而不同方劑中劑量并未有明確規(guī)定,而目前針對柴胡-白芍藥對的研究大多對比單味藥和組方配伍后化學成分、吸收代謝或藥理藥效的變化,缺乏對組方配伍劑量的現(xiàn)代研究,難以說明柴胡-白芍藥對的劑量存在相關性。
本研究從數(shù)據挖掘和數(shù)理統(tǒng)計角度開展對柴胡-白芍經典藥對劑量的研究,從自建方劑庫中收集含柴胡與白芍藥對的傳統(tǒng)中醫(yī)方劑,建立Copula函數(shù)模型,將對證為“肝郁血虛”的方劑中人參劑量和附子劑量進行數(shù)學描述,研究所選方劑中柴胡及白芍所用劑量的相關性,從數(shù)理統(tǒng)計角度研究柴胡-白芍藥對劑量的相互關系,為研究中藥藥對劑量關系提供新思路。
收集從秦漢、唐宋、明清至近代的主要方書,包括經典方書、部分名醫(yī)所著方書、地方用藥規(guī)范、部分地方中藥成方選集等建立方劑庫。從方劑庫篩選方劑,為保證柴胡和白芍的劑量指標的代表性、可獲得性和準確性,篩選條件:(1)方劑中包含柴胡和白芍2味藥物,主治為“肝郁血虛”證;(2)方劑中藥物的劑量描述準確;(3)選取宋代至清代醫(yī)書中的方劑。從符合篩選條件的109首方劑中提取柴胡-白芍藥對劑量數(shù)據,由于藥方單位不統(tǒng)一,不同年代的計量單位與現(xiàn)代計量單位的換算關系不同,按照現(xiàn)代計量換算原則對藥對劑量進行換算[3],見表1,方劑示例見表2。
表1 方劑劑量單位換算原則
表2 部分含柴胡、白芍方劑及劑量
將篩選出的方劑中柴胡劑量和白芍劑量進行數(shù)據處理和檢驗,通過Kolmogorov-Smirnov檢驗[4]或Shapiro-Wilk檢驗[5]對數(shù)據進行正態(tài)檢驗;用Ksdensity函數(shù)對數(shù)據進行擬合邊緣分布。
1.3.1 Copula函數(shù)的選擇
(1)阿基米德Copula函數(shù)族:阿基米德Copula函數(shù)其分布函數(shù)為:
其中,(u) 為阿基米德Copula函數(shù)的生成元,且∈[0, 1][6]。
二元Gumbel Copula函數(shù)的表達式為:
其中,為參數(shù),對上尾變化較敏感,當逐漸增大,若上尾變化特征越明顯,則變量間的相關性越強。
二元Clayton Copula函數(shù)的表達式為:
其中,為參數(shù),對下尾變化較敏感,當逐漸增大,若下尾變化特征越明顯,則變量間的相關性越強。
二元Frank Copula函數(shù)的表達式為:
其中,為參數(shù),其尾部特征具有對稱性,故而其不能捕捉變量間非對稱的尾部相關關系。
(2)橢圓Copula函數(shù)族:二元Gaussian Copula函數(shù)的表達式為[7]:
二元-Copula函數(shù)的表達式為:
其中∈[?1, 1],為?1(),?1() 的線性相關系數(shù)。
(3)Copula函數(shù)的相關性測度:相關系數(shù)能刻畫兩變量之間的相依程度,為精準建模提供核心依據,在測度Copula函數(shù)時,常用到的是Kendal秩相關系數(shù)和Spearman秩相關系數(shù)。當數(shù)據相關系數(shù)(包括Spearman秩相關系數(shù)和Kendall秩相關系數(shù))范圍在 [?1,0)時,變量之間呈負相關;當相關系數(shù)為0時,說明變量間不相關。當相關系數(shù)范圍在 [1,0)時,變量間呈正相關,越接近1,表明變量間相關越密切[8]。
Kendal秩相關系數(shù)τ的表達式為:
Spearman秩相關系數(shù)r的表達式為:
其中(,) 為、的Copula函數(shù)。
1.3.2 統(tǒng)計學方法 利用Epidata3.1軟件進行數(shù)據錄入,使用Matlab進行數(shù)據分析和模型擬合,通過正態(tài)性檢驗,經驗分布函數(shù)和核估計,比較不同類型Copula函數(shù)的歐氏距離等方法來建立柴胡-白芍劑量相關性規(guī)律的模型。
將柴胡劑量和白芍劑量進行統(tǒng)計描述,結果如表3所示,其數(shù)據分布見圖1。
結果表明,方劑組中,柴胡劑量多集中在(0.37,184.5)區(qū)間,中位數(shù)為3.69 g,白芍劑量多集中在(1.11,110.07)區(qū)間,中位數(shù)為11.07 g。
N表示樣本量,Min表示極小值,Max表示極大值,M (IQR) 表示中位數(shù)(四分位數(shù)間距),95% CI表示95%置信區(qū)間
N represents the sample size, Min represents the minimum, Max represents the maximum, M (IQR) represents the median (quartile interval), and 95% CI represents the 95% confidence interval
根據Kolmogorov-Smirnov檢驗結果,柴胡和白芍的Kolmogorov-Smirnov檢驗或Shapiro-Wilk檢驗的值均小于顯著性水平0.05,數(shù)據不符合正態(tài)分布,見表4。
應用Ksdensity函數(shù)分別計算柴胡和白芍的邊緣分布,為避免經驗分布函數(shù)因連續(xù)性及光滑度不好而引起的誤差[9],采用核分布函數(shù)來擬合經驗分布函數(shù)。利用搜集的數(shù)據分別繪制柴胡劑量()的核分布函數(shù)和經驗分布函數(shù)()(圖2)及白芍劑量()的核分布函數(shù)和經驗分布函數(shù)()(圖3),由圖可知,柴胡劑量和白芍劑量的核分布函數(shù)和經驗分布函數(shù)擬合較好。在確定柴胡和白芍的邊緣分布后,得到柴胡劑量()和白芍劑量()的二元分布頻數(shù)直方圖(圖4);從頻率分布直方圖(圖5)可見其數(shù)據具有對稱的尾部特征,可采用Copula函數(shù)對柴胡和白芍之間的非線性關系進行全面分析。
圖1 柴胡-白芍藥對的劑量數(shù)據分布
將篩選出的主治為“肝郁血虛”的109首方劑中,柴胡劑量和白芍劑量代入Copula函數(shù),測算相應的平方歐式距離和參數(shù)估計。結果見表5。
表4 正態(tài)性檢驗
圖2 柴胡劑量的經驗分布函數(shù)和核分布估計圖
圖3 白芍劑量的經驗分布函數(shù)和核分布估計圖
圖4 柴胡和白芍的頻數(shù)分布直方圖
圖5 柴胡和白芍的頻率分布直方圖
表5 Copula函數(shù)的平方歐氏距離及參數(shù)估計值
根據平方歐式距離算法,將多種Copula函數(shù)與經驗分布函數(shù)求解平方歐氏距離,其對應的經驗Copula函數(shù)之間所得距離最短的Copula函數(shù)即為最優(yōu)。由于Gaussian Copula函數(shù)的平方歐式距離為0.013 1,參數(shù)估計為0.411 8,均為最小值,即選擇Gaussian Copula為最優(yōu)函數(shù)。
采用Gaussian Copula能較好的擬合柴胡劑量和白芍劑量之間的關系,其表達式為:
依據Gaussianl Copula函數(shù)繪制柴胡劑量和白芍劑量的聯(lián)合分布函數(shù)Copula(,)(圖6)及聯(lián)合概率密度函數(shù)(,)(圖7),其中柴胡劑量的邊緣分布函數(shù)為(),白芍劑量的邊緣分布函數(shù)為()、柴胡劑量的邊緣密度分布函數(shù)為(),白芍劑量的邊緣密度分布函數(shù)為()。
根據Gaussian Copula函數(shù)建立的模型,數(shù)據呈現(xiàn)出明顯對稱的形態(tài)特征,說明該函數(shù)可以良好地捕捉柴胡劑量和白芍劑量之間的相關性特征,能較好地反映柴胡和白芍之間的相關性。測算其Kendall秩相關系數(shù)為0.330 1,Spearman秩相關系數(shù)為0.471 8,說明柴胡劑量和白芍劑量之間具有較強的非線性相關關系,且之間呈正相關。將橢圓族Copula函數(shù)的Kendall秩相關系數(shù)和Spearman秩相關系數(shù)進行對比發(fā)現(xiàn),Gaussian Copula函數(shù)能更好地反映柴胡劑量和白芍劑量二者之間的秩相關性,Gaussian Copula函數(shù)刻畫的柴胡劑量和白芍劑量,由于上、下尾部均為正相關,且呈現(xiàn)了對稱分布的態(tài)勢,因此,柴胡劑量和白芍劑量在一定程度上表現(xiàn)出同增同減的狀態(tài),即柴胡-白芍藥對在方劑中使用時,其中一味藥的使用劑量增大(或減少)時,另一味藥的使用劑量也傾向于增大(減少),且當柴胡和白芍各自的劑量變化較大時,兩者之間的協(xié)同關系會增強。
圖6 柴胡和白芍的聯(lián)合分布函數(shù)圖
圖7 柴胡和白芍的聯(lián)合概率密度函數(shù)圖
根據“2.1”數(shù)據描述性結果表明,方劑組中,柴胡劑量多集中在(0.37,184.5)區(qū)間,中位數(shù)為3.69 g,白芍劑量多集中在(1.11,110.07)區(qū)間,中位數(shù)為11.07 g,兩者劑量以1∶1的比例居多,顯示柴胡和白芍劑量有一定相關性,但僅從數(shù)據描述和比例頻次研究上難以得出可信結論,本研究建立Copula函數(shù)分析柴胡劑量和白芍劑量相關性,從劑量角度驗證中藥藥對的相并而用。
通過對兩組數(shù)據進行正態(tài)檢驗和數(shù)據擬合邊緣分布結果,柴胡-白芍藥對劑量數(shù)據均不符合正態(tài)分布,呈非線性、非對稱的趨勢。Copula函數(shù)最早是由Sklar[10]提出,是一類將聯(lián)合分布函數(shù)與它們各自的邊緣分布函數(shù)連接在一起的函數(shù),也稱為連接函數(shù),Copula函數(shù)可以捕捉變量間非線性、非對稱以及尾部相關關系[11]。Copula函數(shù)可以捕捉變量間非線性、非對稱以及尾部相關關系[12]。Copula函數(shù)已經用于西醫(yī)臨床聯(lián)合用藥的劑量關系研究,如Yin等[13]提出了一種基于Copula模型的貝葉斯自適應劑量發(fā)現(xiàn)設計,用以研究2種或2種以上藥物聯(lián)合使用時劑量的協(xié)同效應。Gasparini[14]在Copula函數(shù)的基礎上提出了一類新的風險函數(shù),用以評價聯(lián)合治療時臨床相關性。Roberts等[15]使用雙變量Copula函數(shù)分析了貧血和瘧疾之間的關系,發(fā)現(xiàn)貧血和瘧疾之間存在正相關關系,其強度因地區(qū)而異。目前,在中藥藥對配伍劑量的相關研究中尚未運用,本研究創(chuàng)新性運用Copula函數(shù)研究柴胡-白芍藥對劑量數(shù)據的相關性。通過Copula函數(shù)模型分析結果表明,柴胡劑量和白芍劑量呈正相關,這2味藥在用量上是協(xié)同關系,即隨著其中一味藥使用劑量增大時,另一味藥也傾向于劑量增大,從而驗證了柴胡-白芍藥對在方劑配伍使用上的相使規(guī)律,為從數(shù)理統(tǒng)計的角度研究藥物配伍使用規(guī)律提供了參考。
中藥藥對的研究是藥物配伍的最小單元,是單味藥與復方配伍之間的溝通橋梁,并且中藥劑量是藥物配伍中非常重要的因素之一[16],將定性和定量相結合探索藥對之間的關系,對藥物配伍研究具有非常重要的意義,不僅能確定藥物之間的配伍關系,也能在藥物間的使用上產生更好的療效。
中醫(yī)藥在數(shù)千年的發(fā)展過程中積累了大量的成果,蘊含著極其豐富的醫(yī)學理論和療效確切的臨證方劑[17],分析和整理歷代醫(yī)家的用藥劑量來研究藥對的劑量規(guī)律,可為現(xiàn)代中醫(yī)臨床提供更加詳實的藥物劑量參考和依據,還奠定了“量變”(劑量變化)到“質變”(效應變化)的研究基礎。而數(shù)據挖掘技術和數(shù)理統(tǒng)計的引入為處理海量的藥對信息資源提供了有效的技術方法[18]。課題組曾創(chuàng)新性構建Copula函數(shù)模型,研究川芎-當歸藥對在治療月經不調、卒中、瘡瘍時劑量的相關性[19],本研究用Copula函數(shù)模型研究柴胡-白芍藥對在治療肝郁血虛證的劑量相關性,證明Copula函數(shù)模型可成為古方數(shù)據挖掘的重要方法,科學闡釋傳統(tǒng)經典藥對的配伍規(guī)律,以及為指導傳統(tǒng)醫(yī)學臨床用藥提供新的研究模式。
利益沖突 所有作者均聲明不存在利益沖突
[1] 李冀, 李想, 高彥宇, 等. 柴胡-白芍配伍臨床應用及現(xiàn)代藥理學研究進展 [J]. 遼寧中醫(yī)藥大學學報, 2019, 21(7): 8-12.
[2] 常澤, 韓振蘊, 曹云松, 等. 基于網絡藥理學的柴胡-白芍藥對抗抑郁作用機制研究 [J]. 中醫(yī)雜志, 2020, 61(8): 700-705.
[3] 王安妮, 于曉, 張瑜, 等. 基于方劑數(shù)據分析的中藥用量歷史變遷規(guī)律研究 [J]. 世界科學技術—中醫(yī)藥現(xiàn)代化, 2019, 21(3): 342-347.
[4] Pencina M J, Steyerberg E W, D'Agostino R B. Net reclassification index at event rate: Properties and relationships [J]., 2017, 36(28): 4455-4467.
[5] Franklin J M, Rassen J A, Ackermann D,. Metrics for covariate balance in cohort studies of causal effects [J]., 2014, 33(10): 1685-1699.
[6] Neumeyer N, Omelka M, Hudecová ?. A copula approach for dependence modeling in multivariate nonparametric time series [J]., 2019, 171: 139-162.
[7] Karra K, Mili L.for detecting dependence and monotonicity between stochastic signals [J]., 2019, 485: 18-41.
[8] Begg C B, Mazumdar M. Operating characteristics of a rank correlation test for publication bias [J]., 1994, 50(4): 1088-1101.
[9] Zhang M, Chen D H, He X,. A hydrodynamic model for measuring fluid density and viscosity by using quartz tuning Forks [J]., 2019, 20(1): 198.
[10] Sklar B. A primer onconcepts [J]., 1997, 35(12): 94-102.
[11] Thall P F, Nguyen H Q. Adaptive randomization to improve utility-based dose-finding with bivariate ordinal outcomes [J]., 2012, 22(4): 785-801.
[12] Luo W, Wo M. Binary outcome copula regression model with sampling gradient fitting [J]., 2021, 544: 56-77.
[13] Yin G S, Yuan Y. Bayesian dose finding in oncology for drug combinations by Copula regression [J]., 2009, 58(2): 211-224.
[14] Gasparini M. General classes of multiple binary regression models in dose finding problems for combination therapies [J]., 2013, 62(1): 115-133.
[15] Roberts D J, Zewotir T. Copula geoadditive modelling of anaemia and malaria in young children in Kenya, Malawi, Tanzania and Uganda [J]., 2020, 39(1): 1-14.
[16] 段金廒, 宿樹蘭, 唐于平, 等. 中藥藥對配伍組合的現(xiàn)代認識 [J]. 南京中醫(yī)藥大學學報, 2009, 25(5): 330-333.
[17] 曹俊嶺, 李祖?zhèn)? 付強, 等. 中藥及復方整合作用的研究 [J]. 中草藥, 2007, 38(1): 158-160.
[18] 李慧敏, 賀凱, 鄭慧, 等. 中醫(yī)藥健脾的保健作用機制及藥食資源 [J]. 中草藥, 2020, 51(3): 780-787.
[19] Zhao X, Lin W, Li J W,. Dose correlation of Danggui and Chuanxiong drug pairs in the Chinese medicine prescription based on thefunction [J]., 2020, 2020: 1-10.
Study on dose correlation ofandpair in treatment of “l(fā)iver stagnation and blood efficiency” by using Copula function
LIN Wei1, ZHAO He2, HAO Yi-wen2, ZHU Zong-ping2, RAO Ya-shu2, ZHAO Hai-liang3, HAN Guo-xin3, ZHAO Xuan2, LIAO Wan2
1. School of Management, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China 2. State Key Laboratory of Southwestern Chinese Medicine Resources, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China 3. School of Basic Medicine, Chengdu University of Traditional Chinese Medicine, Chengdu 611137, China
To study the dose correlation ofandpair in the treatment of “l(fā)iver stagnation and blood deficiency” by constructing Copula function.The traditional Chinese medicine prescriptions containingandpair for the treatment of "liver stagnation and blood deficiency" syndrome were collected from the self-established prescription database. The data of the dosage ofandwere processed and tested. The best Copula function was selected from Archimedes function family and elliptic Copula function family to establish the data model, depict the joint distribution function diagram, and calculate the Kendal rank correlation coefficient and Spearman coefficient. A rank correlation coefficient was used to monitor the correlation between the dose data ofand.A total of 109 cases of traditional Chinese medicine prescriptions containingandwere collected from the self-established prescription database. Gaussian Copula function model could better reflect the correlation betweenand. The Kendall rank correlation coefficient and Spearman correlation coefficient ofandwere 0.3301 and 0.4718 respectively, which indicated that there is a strong nonlinear correlation betweenand, and the correlation was positive, with the increase of the dose of one medicine, the other medicine also tended to increase the dose.From the perspective of data mining and mathematical statistics, this paper innovatively introduces Copula function model to study the correlation between drug pair and dose, and provides a new research model for the scientific interpretation of traditional classic drug pair compatibility and guiding traditional medical clinical medication.
anddrug pair; liver stagnation and blood deficiency;Copula function; dosage correlation; data mining
R285
A
0253 - 2670(2021)13 - 4007 - 07
10.7501/j.issn.0253-2670.2021.13.023
2021-03-11
國家自然科學基金項目(81803742);四川省科技廳國際合作項目(2018HH0122);四川省科技計劃重點研發(fā)項目(2020YFN0152);成都市科技局國際科技合作項目(2017-GH02-00054-HZ);成都中醫(yī)藥大學杏林學者學科人才科研提升計劃(ZRQNXZ2019028,(ZRQN2019010);四川中醫(yī)藥文化傳承與研究中心項目(2019Y003);四川基層衛(wèi)生事業(yè)發(fā)展研究中心項目(SWFZ20-Y-032);2018年度中醫(yī)藥信息化研究專項(02004906)
林 薇,女,講師,研究方向為中醫(yī)藥統(tǒng)計學。E-mail: linwei@cdutcm.edu.cn
趙 萱,女,副教授,在讀博士,研究方向為中藥新制劑和新劑型。E-mail: zhaoxuan0225@cdutcm.edu.cn
廖 婉,女,博士,教授,碩士生導師,主要從事新制劑、新劑型及中藥炮制工藝與機制研究。E-mail: liaowan2011@126.com
[責任編輯 潘明佳]