閆 艷, 孟慶華, 李廣超, 張桂芝
(江蘇師范大學(xué)化學(xué)化工學(xué)院, 江蘇 徐州 221116)
色譜指紋圖譜歐式距離法的一種改進(jìn)
閆 艷, 孟慶華*, 李廣超, 張桂芝
(江蘇師范大學(xué)化學(xué)化工學(xué)院, 江蘇 徐州 221116)
目的 通過對(duì)歐氏距離算法的改進(jìn)構(gòu)建相對(duì)歐氏距離,使其值能夠精確地反映樣品指紋圖譜與對(duì)照指紋圖譜的相似性。方法 以對(duì)照指紋圖譜為標(biāo)準(zhǔn)建立樣品及對(duì)照比值指紋圖譜,并將樣品與對(duì)照品指紋峰向量差值和的絕對(duì)值和向量差絕對(duì)值的和的比值和各共有峰、非共有峰總面積的權(quán)重系數(shù)引入歐氏距離計(jì)算公式,并計(jì)算指紋圖譜向量模長的比值,利用文獻(xiàn)數(shù)據(jù)評(píng)價(jià)參麥注射液質(zhì)量和中藥材大黃質(zhì)量。結(jié)果 模擬數(shù)據(jù)計(jì)算結(jié)果表明改進(jìn)算法能準(zhǔn)確反應(yīng)指紋圖譜峰間比例關(guān)系的一致性及共有峰總面積的波動(dòng),定量反應(yīng)非共有峰總面積對(duì)相對(duì)歐氏距離的影響.參麥注射液和大黃指紋色譜的計(jì)算結(jié)果與文獻(xiàn)一致。結(jié)論 本文提出的相對(duì)歐氏距離計(jì)算方法和判斷方法可用于中藥產(chǎn)品批間質(zhì)量穩(wěn)定性的控制。
指紋圖譜;歐式距離;質(zhì)量評(píng)價(jià);參麥注射液;大黃
指紋圖譜技術(shù)是目前公認(rèn)的全面控制中藥、食品等復(fù)雜成分體系質(zhì)量的最有效可靠的技術(shù)。指紋圖譜質(zhì)控技術(shù)進(jìn)行質(zhì)量控制的關(guān)鍵是相似度評(píng)價(jià)理論及其軟件化。色譜指紋圖譜相似度評(píng)價(jià)的實(shí)質(zhì)是考察要比較的兩個(gè)指紋圖譜的組成峰數(shù)、峰匹配以及相應(yīng)峰量化關(guān)系的一致性:即一方面從產(chǎn)品質(zhì)量的穩(wěn)定性和一致性考慮,相似度大小應(yīng)能靈敏反映多元化學(xué)成分分布比例的差異和整體含量的差異;另一方面從安全性考慮,相似度大小應(yīng)能考察非共有峰總面積大小對(duì)相似度的影響。有關(guān)色譜指紋圖譜相似度評(píng)價(jià)方法研究已取得了一定的進(jìn)展,文獻(xiàn)報(bào)道的 主 要 有 峰 重 疊 率[1]及 作 者 提 出 的 改 進(jìn) 方法[2]、向量夾角余弦[3]、 相關(guān)系數(shù)[4]、組合相似度[5]、基于相 似 系 統(tǒng) 理 論 的 多 種 程 度 相 似 度[6-8]、總量 統(tǒng) 計(jì) 矩 相 似 度[9]、 距 離 相 似 度 包 括 馬 氏 距離[10]、 歐氏距離[11-13]、 歐馬距離[14]、 指數(shù) 相似系數(shù)法[15]、 以及用相對(duì)熵的歧異值來衡量色譜指紋圖譜的相似度[16]等方法, 文獻(xiàn) [17] 提出了比率定性相似度及投影含量相似度等多個(gè)特性指標(biāo)用于中藥質(zhì)量的控制。這些相似度評(píng)價(jià)方法各有特點(diǎn),但也存在各自的局限性[18], 不能完全滿足指紋圖譜對(duì)中藥質(zhì)量控制的實(shí)際應(yīng)用要求,如相關(guān)系數(shù)、夾角余弦法等相似度不能靈敏地反映小峰的變化和丟失,也不能反應(yīng)圖譜上色譜峰總面積的波動(dòng)變化;基于相似系統(tǒng)理論的多種程度相似度,不能反映非共有峰 (不能與對(duì)照指紋圖譜相匹配的峰)峰值大小對(duì)相似度的影響,其計(jì)算的相似度大小順序有時(shí)與峰值比例的變化趨勢并不一致;組合相似度是在共有峰的夾角余弦相似度基礎(chǔ)上納入了非共有峰的影響,但存在樣本增加或改變時(shí)需重新計(jì)算合適的 ω范圍的問題[5]; 歐馬距離盡管克服了馬氏距離對(duì)變化微小變量的作用放大的缺點(diǎn),但依然和馬氏距離一樣存在要求總體樣本數(shù)大于樣本的維數(shù),另一方面即使?jié)M足了總體樣本數(shù)大于樣本的維數(shù)的條件,但是有些情況下存在無法求出協(xié)方差矩陣的逆矩陣的可能。絕對(duì)歐式距離數(shù)值大小盡管存在受變量單位不同以及檢測器響應(yīng)不同的影響[19-20], 但絕對(duì) 歐 氏 距 離 沒 有 馬 氏 距離存在 的 上述問題,同時(shí) (與夾角余弦等相似度算法比較而言)具有能同時(shí)反映中藥多元化學(xué)成分分布比例的差異和色譜峰總面積的差異,也能考察非共有峰峰值大小對(duì)相似度影響的性能[19], 因此本研究基于分子分母只要取相同計(jì)量單位,其比值大小與分子分母計(jì)量單位無關(guān)的原理,結(jié)合以對(duì)照指紋圖譜為計(jì)算參照標(biāo)準(zhǔn),采用比值法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以修正的待比較樣品指紋圖譜和對(duì)照指紋圖譜間的歐氏距離與對(duì)照指紋圖譜向量模長的比值來計(jì)算指紋圖譜間的相似性,本研究稱之為相對(duì)歐式距離,由于相對(duì)歐式距離是絕對(duì)歐氏距離相對(duì)對(duì)照指紋圖譜模長求得的比值,消除了絕對(duì)歐氏距離存在的上述問題,數(shù)值大小具有直觀的綜合定量評(píng)價(jià)能力,能夠反映指紋峰的相關(guān)性、峰比例關(guān)系的變化和色譜峰總面積的波動(dòng),定量地反映非共有峰總面積大小的影響; 本研究還根據(jù)箱線圖法 ( Box Plot) 原理[21]提出了確定相似性判斷閾值的經(jīng)驗(yàn)方法, 便于根據(jù)相似度大小從質(zhì)量均一性、穩(wěn)定性與安全性上控制藥品、食品的質(zhì)量。
1.1 相似度算法的提出 本研究構(gòu)建的相似度算法是基于事先確定的對(duì)照指紋圖譜為計(jì)算參照標(biāo)準(zhǔn);以中藥色譜指紋圖譜峰面積值或峰高為相似度評(píng)價(jià)信息參數(shù);以圖譜矢量化空間模式向量間相似性計(jì)算為基本出發(fā)點(diǎn)。
圖1 樣品指紋圖譜和對(duì)照指紋圖譜向量圖Fig.1 Vectors of sam p le fingerp rint and standard fingerprint
1.2 相似度算法的優(yōu)化 當(dāng)樣品指紋圖譜色譜峰比對(duì)照指紋圖譜對(duì)應(yīng)峰都偏大時(shí),樣品與對(duì)照樣品的化學(xué)成分分布比例較一致,而如果樣品指紋圖譜色譜峰比對(duì)照指紋圖譜對(duì)應(yīng)峰一部分偏大另一部分偏小時(shí),二者的化學(xué)成分分布比例相差較大,采用式 (1) 計(jì)算上述兩種情況的相似性時(shí)不能靈敏反應(yīng)這種差異, 必須對(duì)公式 (1) 進(jìn)行修正, 修正后的計(jì)算方法見公式 (2)。
由于中藥組成成分復(fù)雜,各成分的結(jié)構(gòu)及藥效等不盡相同,故對(duì)中藥指紋圖譜相似性評(píng)價(jià)時(shí),各成分可能存在有不同的比重系數(shù)。為此,實(shí)際應(yīng)用時(shí)可考慮根據(jù)藥效、毒性研究等確定中藥不同成分相似性評(píng)價(jià)的藥效影響因子,對(duì)指紋圖譜相似性評(píng)價(jià)中的特征變量進(jìn)行加權(quán)運(yùn)算。加權(quán)運(yùn)算公式為公式 (5):
式中 δi、δa分別是各共有峰、 非共有峰總面積的權(quán)重系數(shù), 權(quán)重的取值范圍 δi≥0 或 δa≥0, δi、δa取值原則是: ①向量的各維變量對(duì)產(chǎn)品有效性安全性影響不明確時(shí) δi及 δa可全取 1;②某些變量對(duì)產(chǎn)品有效性安全性影響非常明顯時(shí) δi>1 或 δa>1,具體大小通過實(shí)驗(yàn)確定;③某些變量對(duì)產(chǎn)品有效性安全性影響較小時(shí) 1 >δi≥0 或 1 >δa≥0,具體大小通過實(shí)驗(yàn)確定。 確定 δi、δa大小的具體試驗(yàn)方法有待進(jìn)一步研究。
1.3 相似度判斷閾值 d限的確定方法 公式 (4)用于判定中藥批次間產(chǎn)品質(zhì)量是否穩(wěn)定的實(shí)際應(yīng)用時(shí),需要確立一個(gè)科學(xué)合理的相似度評(píng)價(jià)閾值;閾值的確定前提是必須首先確定對(duì)照指紋圖譜,這顯然要事先選擇一些已鑒定好的合格的中藥產(chǎn)品樣本并獲得其相應(yīng)的中藥色譜指紋圖譜;合格品的最終選擇只有通過有效性、安全性試驗(yàn)確定,目前的指紋圖譜技術(shù)發(fā)展水平還難于實(shí)現(xiàn)。根據(jù)本實(shí)驗(yàn)室對(duì)試驗(yàn)數(shù)據(jù)和文獻(xiàn)數(shù)據(jù)計(jì)算驗(yàn)證經(jīng)驗(yàn),提出一種結(jié)果較可靠、操作性較強(qiáng)的經(jīng)驗(yàn)方法:①根據(jù)專家經(jīng)驗(yàn)或其他方法選擇不少于 10個(gè)批次的正品藥材或中藥制劑產(chǎn)品;②采用計(jì)算機(jī)技術(shù)對(duì)這些正品藥材或中藥制劑產(chǎn)品的指紋圖譜數(shù)據(jù)進(jìn)行預(yù)處理和色譜峰匹配;③對(duì)被保留的藥材或中藥制劑產(chǎn)品的指紋圖譜用平均矢量法或中位數(shù)矢量法,優(yōu)選穩(wěn)健性較好的中位數(shù)矢量法初步建立該產(chǎn)品的對(duì)照指紋圖譜;④用式 (4) 計(jì)算被保留的每個(gè)正品藥材或中藥制劑產(chǎn)品的指紋圖譜與初步確定的對(duì)照指紋圖譜相似度的 Syj;⑤ 根 據(jù) 箱 線 圖 法 ( Box Plot) 原 理[21],對(duì) dyj數(shù)據(jù)按從小到大排序, 并求出該序列數(shù)據(jù)的統(tǒng)計(jì)量第一四分位數(shù) Q1、 第三四分位數(shù) Q3, 并求出這兩個(gè)四分位數(shù)差值 df=Q3-Q1, 將所有 Syj數(shù)據(jù)與 Q3+1.5df比較, 所有大于 Q3+1.5df的 dyj數(shù)據(jù)判斷為異常值而將對(duì)應(yīng)藥材或中藥制劑產(chǎn)品剔除, 重復(fù)③ ~⑤步, 直至 dyj系列不再出現(xiàn)異常值;⑥被保留藥材或中藥制劑產(chǎn)品的指紋圖譜的按③步確定最終對(duì)照指紋圖譜, 按④步計(jì)算的 dyj系列,其中的最大值即為 d限。
本研究以模擬數(shù)據(jù)計(jì)算結(jié)果研究比較相似性新算法及其他相似度算法的性能,并將本研究提出的方法應(yīng)用于文獻(xiàn)指紋圖譜數(shù)據(jù), 相關(guān)計(jì)算采用 matlab 軟件 (Mathwork Inc.)自行編寫程序。
3.1 定性比較新算法與其他相似度算法 假設(shè)有某一產(chǎn) 品 的對(duì)照指紋 圖 譜向量和 3 個(gè) 待比較樣品指紋圖譜 向 量如 圖 1b 所 示,、是 3 個(gè)樣品 指 紋 圖譜向量與的差向量,分 別表示向 量之間的歐氏距離向 量在向量的投影是在 向 量上 的 投 影,表 示 向 量的 模長,表 示 向量的模長。 從 圖 1 可以
3.2 定量比較新算法與其他相似度算法 表 1 是采用差異明確的模擬數(shù)據(jù)來考察4種相似度的計(jì)算結(jié)果。表中對(duì)照樣品假設(shè)有6個(gè)色譜峰,各峰值大小依次為 1、 5、 10、 15、 20、 25; 1 ~6 號(hào)樣品是對(duì)對(duì)照樣品稀釋或濃縮不同倍數(shù)的樣品,稀釋或濃縮的倍數(shù)分別為 0.5、 0.9、 1.1、 1.5、 2.0 和3.0;7 ~12 號(hào)樣品除含對(duì)照樣品中種類相同濃度相同的6個(gè)成分外,還多出一個(gè)對(duì)照樣品中沒有的非共有成分, 非共有成分的峰大小依次由 1 變?yōu)?25;13號(hào)樣品與3號(hào)樣品各峰值大小相對(duì)于對(duì)照樣品各峰的差異都為 10%, 但變化方向不同, 3 號(hào)樣品所有峰都比對(duì)照指紋圖譜峰偏大, 而 13 號(hào)樣品比對(duì)照指紋圖譜峰后三個(gè)峰偏大, 前三個(gè)峰偏小; 14號(hào)樣品的二號(hào)小峰與 15 號(hào)樣品的六號(hào)大峰相對(duì)對(duì)照指紋圖譜的相對(duì)差異相同, 都為 10%, 其余峰值與對(duì)照樣品對(duì)應(yīng)峰大小相同; 16號(hào)樣品的二號(hào)小峰與17號(hào)樣品的六號(hào)大峰相對(duì)對(duì)照指紋圖譜的絕對(duì)差異相同,都為3, 其余峰值與對(duì)照樣品對(duì)應(yīng)峰大小相同。
表1 用4種相似度算法計(jì)算的模擬數(shù)據(jù)相似度結(jié)果Tab.1 Resu lts of four sim ilarity algorithm s based on simulated data
表1中1~6號(hào)樣品的相似度數(shù)據(jù)表明當(dāng)峰值大小的總差異不超過 100%時(shí), 本研究定義的相對(duì)歐氏距離d的數(shù)值大小與樣品和參照樣品的相對(duì)平均差異大小一致, 而改良程度相似度 q、 新改良程度相似度 q'數(shù)值大小與樣品相對(duì)參照樣品的相對(duì)含量一致,從不同角度都能給出直觀的綜合定量評(píng)價(jià)結(jié)果; 即使相對(duì)差異超過 100%, 數(shù)值的大小也能反映樣品和參照樣品的差異,本研究計(jì)算的相對(duì)歐式距離越大,樣品與對(duì)照樣品的差異越大;而夾角余弦相似度 cosθ全為 1, 不能反應(yīng)樣品與參照樣品的這種總量的差異。 7 ~12 號(hào)樣品與對(duì)照樣品非共有峰峰值由1 變?yōu)?5時(shí), 本研究定義相對(duì)歐氏距離 d 由 0.005 4 變化為 0.134 3; 夾角余弦相似度cosθ由 0.999 6 變化 0.829 3; 表明相對(duì)歐氏距離d、 夾角余弦相似度 cosθ都能定量地反映非共有峰峰大小的影響,而改良相似度q及新改良程度相似度 q'由于只能反應(yīng)共有峰的變化對(duì)相似度的影響,相似度全為 1。相對(duì)于對(duì)照指紋圖譜而言,13 號(hào)樣品峰比例關(guān)系的一致性比3號(hào)樣品峰比例關(guān)系的一致性要差, 按公式 (3) 計(jì)算的相對(duì)歐氏距離 d13號(hào)樣品的 0.181 6 大于 3 號(hào)樣品 0.100 0, 與實(shí)際一致且二者的相對(duì)歐氏距離 d的差值△d比夾角余弦值差值大,而改良程度相似度q及新改良程度相似度 q'不能反映這種差異。 表 1 中 14 號(hào)、 15 號(hào)樣品相似性數(shù)據(jù)表明按公式 (4) 計(jì)算的相對(duì)歐氏距離d無論大峰還是小峰,只要相對(duì)差異相同對(duì)性的影響是一樣的,而夾角余弦值對(duì)大小峰的靈敏度是不同的。 16 號(hào)、 17 號(hào)樣品相似度數(shù)據(jù)表明按公式(4) 計(jì)算的相對(duì)歐氏距離 d 能靈敏反應(yīng)大小峰產(chǎn)生相同的絕對(duì)差異時(shí)對(duì)相似性不同的影響, 對(duì)16號(hào)樣品小峰的絕對(duì)差異為 3 時(shí)相對(duì)差異為 60%,而17號(hào)樣品大峰的絕對(duì)差異為 3 時(shí)相對(duì)差異為12%,因此 17 號(hào)樣品的相對(duì)歐氏距離 0.049 0 小于 16 號(hào)樣品的相對(duì)歐氏距離 0.245 0。上述結(jié)果表明:本研究建立的指紋圖譜相似度算法既能靈敏反映指紋圖譜各成分含量比例的變化,也能反映總量的變化及非共有峰的影響,且無論對(duì)大峰還是小峰都表現(xiàn)出較高的敏感性。
3.3 計(jì)量單位以及檢測器不同的響應(yīng)對(duì)相對(duì)歐氏距離的影響 相同條件下同一樣品指紋圖譜色譜峰面積或峰高大小與采用的計(jì)量單位有關(guān),但不同的計(jì)量單位間存在一定的換算系數(shù) k,假設(shè)yi由某已計(jì)量單位換算成另一計(jì)量單位,數(shù)值大小變?yōu)閗xi、代入式 (4) 整理如式 (6), 顯然 d 值與k無關(guān)。盡管不同儀器不同的檢測器響應(yīng)不同,檢測器間響應(yīng)值比是固定不變的,這類似于峰值計(jì)量單位的不同情況,檢測器不同響應(yīng)對(duì)d值大小理論上沒有影響,甚至采用適當(dāng)方法測量出不同檢測器間比值對(duì)不同儀器獲取數(shù)據(jù)校正后,不同儀器獲取數(shù)據(jù)可通用。
3.4 新算法評(píng)價(jià)中藥制劑質(zhì)量穩(wěn)定性的應(yīng)用 表2 是文獻(xiàn) [10] 中 23 個(gè)參麥注射液樣品指紋圖譜數(shù)據(jù)及采用式 (4)計(jì)算的相對(duì)歐氏距離結(jié)果;1 ~11 號(hào)是以工藝 A制得的參麥注射液樣品, 作為合格品, 12 ~17 號(hào)以工藝 B制得的參麥注射液樣品, 2’、 3’、 4’、 5’、 9’ 號(hào)是 2、 3、 4、 5、 9 號(hào)參麥注射液樣品的重復(fù)進(jìn)樣獲得的指紋圖譜, 18號(hào)是以西洋參代替紅參所作的偽品;對(duì)照指紋圖譜是以中位矢量法用 1 ~11 號(hào)樣品指紋圖譜數(shù)據(jù)確定的。 根據(jù)本研究確定相對(duì)歐氏距離判斷閾值 d限的方法, 發(fā)現(xiàn)7號(hào)樣品和 11 號(hào)樣品為異常樣品, 剔除 7、 11 號(hào)樣品后, 將 1 ~6 號(hào)、 9 ~10 號(hào)作為合格樣本,以中位法重新確定對(duì)照指紋圖譜,依次以公式 (4)計(jì)算 1 ~6 號(hào)、9 ~10 號(hào)、 2’、 3’、4’、5’、 9’號(hào)、 7 號(hào)、 11 號(hào)及 12 ~18 號(hào)樣品相對(duì)新對(duì)照指紋圖譜的相對(duì)歐氏距離,結(jié)果按順序?yàn)?.232 9、 0.197 1、 0.202 8、 0.437 3、 0.094 8、0.303 6、 0.345 1、0.237 8、0.188 2、0.222 9、0.197 6、 0.421 7、0.102 8、0.239 5、0.975 3、0.718 8、 2.132, 2.700, 2.941, 1.939 3, 3.726,3.263, 11.89; 1 ~6 號(hào)、 9 ~10 號(hào)合格樣本的相對(duì)歐氏距離未發(fā)現(xiàn)異常值,4號(hào)樣本的相對(duì)歐氏距離0.437 3 為最大, 確定為判斷閾值 d限; 顯然 12 ~18號(hào)相對(duì)歐氏距離 d 值均大于 0.437 3, 可判定為不合格品 (工藝 B與工藝 A有顯著差別), 2’、 3’、 4’、5’、 9’ 號(hào)相似度的均小于 0.437 3, 可判定為合格品,特別是 18 號(hào)偽品其相對(duì)歐氏距離最大為 11.89,按新的閾值 d限判斷, 7、 11 號(hào)樣品依然為異常樣品,分析7、 11 號(hào)樣品指紋圖譜數(shù)據(jù)可發(fā)現(xiàn), 二者的指紋圖譜第一個(gè)色譜峰值分別為 2.72、 3.05, 明顯比其他合格樣本對(duì)應(yīng)峰值大得多,說明判斷是合理的;即使在剔除 7、 11 號(hào)樣品前計(jì)算的相對(duì)歐氏距離,從表1 的數(shù)據(jù)也可以看出1 ~11 號(hào)樣本的相對(duì)歐氏距離也遠(yuǎn)小于 12 ~18 號(hào)樣品的相似度, 表明公式(4) 算法計(jì)算的相對(duì)歐氏距離能夠反應(yīng)兩種不同工藝的差別, 從另一個(gè)角度說明公式 (4) 算法計(jì)算能夠反應(yīng)中藥制劑質(zhì)量的穩(wěn)定性均勻性。
表 2 18 批參麥注射液指紋圖譜數(shù)據(jù)及相對(duì)歐式距離相似度結(jié)果Tab.2 Data of chromatographic fingerprints of 18 batches of Shenmai Injection and results of their sim ilarity
3.5 新算法評(píng)價(jià)中藥材質(zhì)量優(yōu)劣的應(yīng)用 表 3 是文獻(xiàn) [22] 中 19 個(gè)大黃樣品的指紋圖譜數(shù)據(jù)及采用公式 (4) 計(jì)算的相對(duì)歐氏距離 d 結(jié)果。 1 ~5號(hào)、 8 ~11 號(hào)樣本在原始文獻(xiàn)中定為正品大黃樣品, 6、 7 號(hào)及 12 ~19 號(hào)是待鑒定大黃樣品, 表中對(duì)照指紋圖譜是按 “3.3” 節(jié)同樣的方法剔除 4 號(hào)樣本后以1 ~3 號(hào)、 5 號(hào)、 8 ~11 號(hào)為合格樣本指紋圖譜數(shù)據(jù)用中位矢量法確定的。根據(jù)本研究提出的相對(duì)歐氏距離判斷閾值 d限的確定方法, 1 ~3 號(hào)、 5號(hào)、 8~11 號(hào)相對(duì)歐氏距離無奇異值, 最終確定大黃相對(duì)歐氏距離的閾值 d限為 1.904 3; 顯然 6、7 號(hào)樣品相對(duì)歐氏距離 d 值均小于 1.904 3, 可判定為合格品; 12 ~19 樣品相對(duì)歐氏距離 d 的值均遠(yuǎn)大于1.904 3, 可判斷它們屬非合格品, 這與文獻(xiàn)6、 7 號(hào)為正品, 12 ~19 為非正品的結(jié)論是一致的。盡管原文獻(xiàn)把4號(hào)樣品作為正品大黃,但4號(hào)樣品的指紋圖譜數(shù)據(jù)表明, 其第 10 個(gè)和第 14 個(gè)色譜峰面積(分別為 94.4、 28.1) 比其他正品大黃對(duì)應(yīng)色譜峰遠(yuǎn)遠(yuǎn)大得多 (對(duì)照指紋圖譜相應(yīng)峰面積分別為8.90、 1.40), 說明其內(nèi)在化學(xué)成分與其他正品大黃有顯著差異,剔除是合理的。上述數(shù)據(jù)表明本研究構(gòu)建的相對(duì)歐氏距離算法可用于中藥材質(zhì)量控制。
表 3 19 批大黃藥材指紋圖譜數(shù)據(jù)及相對(duì)歐式距離相似度結(jié)果Tab.3 Data of chromatographic fingerprints of 19 batches of Rhei Radix et Rhizoma and results of their sim ilarities
綜上所述,模擬數(shù)據(jù)計(jì)算結(jié)果顯示本研究構(gòu)建的相對(duì)歐氏距離算法不僅能夠準(zhǔn)確靈敏地反應(yīng)指紋圖譜共有峰峰分布比例關(guān)系的變化和峰面積總量的波動(dòng),也能夠定量反應(yīng)非共有峰總面積大小對(duì)相似度的影響,具有較好的綜合評(píng)價(jià)能力;本研究根據(jù)箱線圖法原理提出的確定相對(duì)歐氏距離判斷閾值的經(jīng)驗(yàn)方法具有較強(qiáng)的可操作性和實(shí)用性,利用文獻(xiàn)數(shù)據(jù)對(duì)參麥注射液質(zhì)量和藥材大黃質(zhì)量的評(píng)價(jià)結(jié)果表明方法可用于中藥產(chǎn)品批次間質(zhì)量的均一性、穩(wěn)定性和安全性評(píng)價(jià);數(shù)據(jù)顯示用于中藥材的相對(duì)歐氏距離判斷閾值比中藥制劑的相對(duì)歐氏距離判斷閾值要大,主要由于中藥材內(nèi)在化學(xué)成分是次生代謝產(chǎn)物受各種因素影響變化較大,而中藥制劑經(jīng)生產(chǎn)工藝過程的控制,內(nèi)在化學(xué)成分質(zhì)量較均一穩(wěn)定,這本就是中藥指紋圖譜質(zhì)控技術(shù)的目的所在,顯然利用本研究提出的方法能夠篩選出質(zhì)量更為穩(wěn)定的原藥材,更有利于中藥質(zhì)量穩(wěn)定可控。
[ 1] 洪筱坤, 王智華.中藥數(shù)字化色譜指紋譜[M].上海: 上海科學(xué)技術(shù)出版社, 2003: 82-83.
[2] 孟慶華,劉永鎖,王健松,等.色譜指紋圖譜相似度的新算法及其應(yīng)用[J].中成藥, 2003, 25(1): 4-8.
[3] 王龍星,肖紅斌,梁鑫淼,等.一種評(píng)價(jià)中藥色譜指紋譜相似性的新方法: 向量夾角法[ J].藥學(xué)學(xué)報(bào), 2002, 37(9): 713-717.
[4] 田潤濤, 謝培山.色譜指紋圖譜相似度評(píng)價(jià)方法的規(guī)范化研究 (一) [J].中藥新藥與臨床藥理, 2006, 17(1): 40-42, 54.
[5] 詹雪艷,史新元,段天璇,等.色譜指紋圖譜組合相似度的算法[ J] .色譜, 2010, 28(11) : 1071-1076.
[6] 劉永鎖,孟慶華,蔣淑敏,等.相似系統(tǒng)理論用于中藥色譜指紋圖譜的相似度評(píng)價(jià)[J].色譜, 2005, 23(2): 158-163.
[7] 劉永鎖,曹 敏,王義明,等.相似系統(tǒng)理論定量評(píng)價(jià)中藥材色譜指紋圖譜的相似度[J].分析化學(xué), 2006, 34(3):333-337.
[8] 詹雪艷,史新元,展曉日,等.基于相似系統(tǒng)理論的相似度計(jì)算方法的改進(jìn)[ J].分析化學(xué), 2010, 38(2) : 253-257.
[9] 賀福元,周宏灝,鄧凱文,等.指紋圖譜的一種定性定量研究新方法_ 總量統(tǒng)計(jì)矩分析法[J].藥學(xué)學(xué)報(bào), 2008, 43(2): 195-201.
[10] 吳 昊, 田燕華, 郭平平, 等.多元統(tǒng)計(jì)學(xué)在參麥注射液指紋圖譜中的應(yīng)用[J].中成藥, 2002, 24(1): 3-6.
[11] 葉 皓, 沈 順, 張祥民.液相指紋圖譜結(jié)合歐氏距離對(duì)野菊花質(zhì)量控制的研究[J].世界科技研究與發(fā)展, 2006,28(2): 72-74.
[12] 李希強(qiáng), 陸舍銘, 王 笛, 等.煙用香精 UPLC指紋圖譜的夾角余弦、 相關(guān)系數(shù)與歐氏距離評(píng)價(jià)[J].煙草科技,2008(12): 37-41.
[13] 李希強(qiáng), 王 笛, 陸舍銘.夾角余弦與歐式距離相結(jié)合建立煙用香精 HPLC指紋圖譜[J].香料香精化妝品, 2007,(6): 26-30.
[14] 趙曰利, 于宏曉, 宗兆奇, 等.歐馬距離法在香料指紋圖譜模式識(shí)別中的應(yīng)用[J].煙草科技, 2011(2): 52-57.
[15] 谷瑞敏, 郭治昕, 劉巍巍, 等.中藥色譜指紋圖譜相似度評(píng)價(jià)新模型及其論證[ J] .中成藥, 2009, 31(1) : 1-4.
[16] 王 康, 杜 凱, 李 華.相對(duì)熵方法用于中藥指紋圖譜相似度計(jì)算[ J].計(jì)算機(jī)與應(yīng)用化學(xué), 2007, 24 (1):49-52.
[17] 孫國祥, 侯志飛, 張春玲, 等.色譜指紋圖譜定性相似度和定量相似度的比較研究[J].藥學(xué)學(xué)報(bào), 2007, 42(1) :75-80.
[18] 關(guān)洪月, 李 林, 劉 曉, 等.中藥指紋圖譜相似度計(jì)算方法探析[J].中國實(shí)驗(yàn)方劑學(xué)雜志, 2011, 17(18) : 282-287.
[19] 吳玉田, 柴逸峰.藥物分析信息學(xué)及應(yīng)用[M].北京: 人民衛(wèi)生出版社, 2009: 143.
[20] 聶 磊, 曹 進(jìn), 羅國安, 等.中藥指紋圖譜相似度評(píng)價(jià)方法的比較[J].中成藥, 2005, 27(3): 249-252.
[21] 莊作欽.BOXPLOT_ 描述統(tǒng)計(jì)的一個(gè)簡便工具[ J].統(tǒng)計(jì)與預(yù)測, 2003, 2: 56-57.
[22] 洪筱坤, 王智華, 李 旭.HPLC-相對(duì)保留值指紋圖譜鑒別大黃[J].中國中藥雜志, 1993, 18(11): 650-652.
Im provement of Euclidean distance between chromatographic fingerprints
YAN Yan, MENG Qing-hua*, LIGuang-chao, ZHANG Gui-zhi
(School of Chemistry&Chemical Engineering, Jiangsu Normal University, Xuzhou 221116, China)
AIM To improve the algorithm of the relative Euclidean distance in order to accurately reflect the similarities between chromatographic fingerprints of herbs.METHODS The ratio of sample and reference chromatographic fingerprintswere established for reference standard of chromatographic fingerprints.The absolute value of the sum of the vector difference and the sum of absolute value of the vector difference of sample and reference chromatographic fingerprints and the weight coefficients of common peaks and non common peakswere brought into the calculation of Euclidean distance,and their norm of vector.Lecture data of Shenmai Injection and Rhei Radix et Rhizoma were served as the computation.RESULTS The improved algorithm could reflect the uniformity of peak area ratios and fluctuation of total peak areas and quantified the influence of non common peaks on relative Euclide-an distance.The data from algorithm applied to the chromatographic fingerprints of Shenmai Injection and Rhei Radix et Rhizoma were consistentwith the lecture data.CONCLUSION The algorithm may be applicable for the quality evaluation of differentbatches of herbal preparations.
fingerprints; similarity;Euclidean distance;quality evaluation; Shenmai Injection;RheiRadix et Rhizoma
R284.1
: A
: 1001-1528(2014)05-1012-09
10.3969/j.issn.1001-1528.2014.05.028
2013-06-04
江蘇省徐州市科技發(fā)展基金 (XF10C015)
閆 艷 (1987—) , 女, 碩士, 從事藥品分析研究。 Tel: (0516) 83403165, E-mail: 571472309@qq.com
*通信作者: 孟慶華 (1965—) , 男, 博士, 副教授, 研究方向: 中藥質(zhì)量控制。 Tel: (0516) 83403165, E-mail: mqhxz@126.com