符娟娟, 馬丹英, 唐金蘭, 包一麟, 趙 遠(yuǎn), 尚林偉, 尹建華
南京航空航天大學(xué)自動(dòng)化學(xué)院生物醫(yī)學(xué)工程系, 江蘇 南京 211106
關(guān)節(jié)軟骨是覆蓋于骨關(guān)節(jié)表面的半透明、 光滑的結(jié)締組織, 具有彈性和韌性, 能減少關(guān)節(jié)面間的摩擦、 承受高負(fù)荷和緩沖震動(dòng)[1]。 關(guān)節(jié)軟骨主要由軟骨細(xì)胞(占總體積的1%~2%)和軟骨基質(zhì)(占總體積的98%~99%)組成[2]。 軟骨基質(zhì)從外表面到軟骨下骨之間具有明顯的板層狀結(jié)構(gòu), 一般分為3層: 表層區(qū)(SZ, 軟骨總厚度的10%)、 過渡區(qū)(TZ, 軟骨總厚度的10%)、 深層區(qū)(DZ, 軟骨總厚度的80%)[3]。 基質(zhì)中主要含有水、 膠原蛋白(Collagen)、 蛋白多糖(PG)和少量無機(jī)鹽離子[4]。 其中膠原蛋白排列成網(wǎng)架結(jié)構(gòu), 維持軟骨的結(jié)構(gòu)和形狀, 并能有效固定PG[5]。 而PG可以保證關(guān)節(jié)軟骨的彈性和耐壓性。 在3個(gè)分區(qū)中, 深度不同其基質(zhì)主成分結(jié)構(gòu)和含量也不同[3]。 肥胖、 增齡、 負(fù)傷和過度使用等因素都可能會(huì)導(dǎo)致關(guān)節(jié)軟骨整體結(jié)構(gòu)和成分含量的變化, 從而導(dǎo)致骨關(guān)節(jié)炎(OA)[6]。 OA的初級(jí)病變主要表現(xiàn)在細(xì)胞外基質(zhì)成分含量和軟骨細(xì)胞形態(tài)的變化, 在臨床上的表現(xiàn)并不明顯, 且現(xiàn)有的臨床方法和實(shí)驗(yàn)方法并不能較準(zhǔn)確的識(shí)別OA的早期病變[7-10], 對(duì)OA的早期診斷造成極大困難。
傅里葉變換近紅外(FTNIR)光譜技術(shù)近年來因?yàn)槠浞治鏊俣瓤臁?成本低、 易于穿透組織并含有對(duì)應(yīng)組織成分信息等特點(diǎn)而發(fā)展應(yīng)用較為迅速, 已被用于手術(shù)導(dǎo)航、 無損檢測和疾病診斷等各個(gè)領(lǐng)域。 NIR光譜范圍內(nèi)的光譜吸收主要來自O(shè)—H, C—H, N—H和S—H鍵泛頻的伸縮振動(dòng), 不同的基團(tuán)或是同一基團(tuán)在不同的化學(xué)環(huán)境中NIR吸收的波長和強(qiáng)度存在差異[11]。 關(guān)節(jié)軟骨基質(zhì)成分中的膠原蛋白和蛋白多糖中含有近紅外光可探測的大分子鍵(O—H, C—H, N—H和S—H),使得NIR光譜學(xué)成為探測關(guān)節(jié)軟骨微觀和宏觀變化合適的光學(xué)技術(shù)[12-13]。 然而, 樣品的狀態(tài)、 光的散射、 儀器等因素會(huì)使NIR光譜產(chǎn)生一些與待測樣品無關(guān)的干擾, 導(dǎo)致NIR光譜的基線漂移或重復(fù)性不強(qiáng)等問題, 因此對(duì)原始光譜進(jìn)行預(yù)處理非常必要。 同樣, 光譜預(yù)處理選擇會(huì)很大程度的影響預(yù)測的準(zhǔn)確性, 故選擇合適的預(yù)處理方法至關(guān)重要。 關(guān)節(jié)軟骨主成分膠原蛋白、 蛋白多糖和水的特征譜帶在5 300~4 000 cm-1范圍內(nèi)[14], 將此波段的光譜進(jìn)行分析并與化學(xué)計(jì)量學(xué)算法相結(jié)合有利于實(shí)現(xiàn)快速的樣本分類和識(shí)別[15]。
主成分分析(PCA)是一種通過降維技術(shù)從多個(gè)原始數(shù)據(jù)提取重要信息的分析方法。 為了盡量減少變量和研究對(duì)象數(shù)據(jù)信息的損失, 選取累計(jì)方差貢獻(xiàn)率達(dá)85% 以上的主因子作主成分分析[16]。 Fisher 判別(FDA)通過方差分析建立判別函數(shù), FDA的原則是使類別間的分散盡可能大, 類別內(nèi)的分散盡可能小。 通過比較分類中心和樣本之間的距離, 快速對(duì)數(shù)據(jù)集進(jìn)行分類識(shí)別[17]。
本研究采用FTNIR 技術(shù)對(duì)不同分區(qū)(SZ, TZ, DZ)健康和病變的關(guān)節(jié)軟骨進(jìn)行分析, 結(jié)合PCA-FDA方法挑選出最佳光譜預(yù)處理方法和識(shí)別分區(qū), 基于該最佳預(yù)處理方法將PCA-FDA應(yīng)用于OA不同時(shí)期的有效識(shí)別。
用于NIR光譜分析的所有比格犬的膝關(guān)節(jié)樣本, 均由江蘇南京亞東實(shí)驗(yàn)動(dòng)物研究中心提供, 并經(jīng)倫理審查機(jī)構(gòu)批準(zhǔn)(SCXK蘇2016-0009)。 選擇9只健康比格犬, 對(duì)其中3只(Y7, Y8, Y9)的左后腿膝關(guān)節(jié)脛骨平臺(tái)進(jìn)行原位提取, 從而獲取健康樣本; 其余6只進(jìn)行任一單后腿的膝關(guān)節(jié)前交叉韌帶橫切(ACL)手術(shù)后[18], 分別培養(yǎng)3個(gè)月(OA-3M: Y1, Y2, Y3)和7個(gè)月(OA-7M: Y4, Y5, Y6), 再從相應(yīng)手術(shù)側(cè)的后腿膝關(guān)節(jié)脛骨平臺(tái)提取樣本。 從實(shí)驗(yàn)犬獲得關(guān)節(jié)軟骨樣本后, 用生理鹽水沖洗, 然后將關(guān)節(jié)軟骨切割成大小為2 mm×2 mm×2 mm的小塊樣本, 再經(jīng)去離子水包埋及液氮速凍后, 用低溫切片機(jī)(Leica CM 1950,Germany)沿著平行于軟骨表面的方向?qū)④浌菢颖疽?0 μm的厚度進(jìn)行連續(xù)切片, 并將切片移取到直徑為13 mm, 厚2 mm的硒化鋅(ZnSe)晶片上(江蘇南晶紅外光學(xué)儀器有限公司), 然后將樣本置于空氣中風(fēng)干2 h再進(jìn)行NIR光譜數(shù)據(jù)采集。
軟骨切片樣本信息如表1所示, 實(shí)驗(yàn)所選用的比格犬關(guān)節(jié)軟骨切塊厚度低于1 050 μm。 因?qū)嶒?yàn)中3, 4和11號(hào)切塊深度為50 μm(最表層)的切片樣本缺失, 未進(jìn)行光譜檢測。
表1 關(guān)節(jié)軟骨水平切片的樣本信息Table 1 Sample information of horizontalsection of articular cartilage
采用傅里葉變換紅外光譜儀(Vertex 70, Bruker公司)及配套的OPUS 7.0軟件對(duì)ZnSe晶片上樣本以透射模式進(jìn)行NIR光譜數(shù)據(jù)采集, 光譜采集范圍10 000~4 000 cm-1, 光譜分辨率8 cm-1, 掃描16次。 在OPUS軟件中采用計(jì)算相對(duì)積分面積表示基線校正后的特征譜帶的吸光度。 OA-3M組中切塊編號(hào)為1—3和5—6; OA-7M組中切塊編號(hào)為7—10; 健康組切塊編號(hào)為12—15和18的切片(214組)光譜數(shù)據(jù)用于健康和OA的分類分析, 研究不同預(yù)處理方法對(duì)健康和病變樣本識(shí)別率的影響。 在導(dǎo)數(shù)預(yù)處理不同參數(shù)結(jié)合PCA-FDA的結(jié)果中, 發(fā)現(xiàn)一階導(dǎo)數(shù)中2次多項(xiàng)式21點(diǎn)Savitzky-Golay平滑和二階導(dǎo)數(shù)中3次多項(xiàng)式25點(diǎn)Savitzky-Golay平滑的結(jié)果最優(yōu)。 故本研究先采用Unscrambler X軟件(CAMO Software,Inc.,Woodbridge,NJ)對(duì)獲得的光譜數(shù)據(jù)分別進(jìn)行基線校正(BC)、 一階導(dǎo)數(shù)2次多項(xiàng)式21點(diǎn)Savitzky-Golay平滑(1st-2-21SG)和二階導(dǎo)數(shù)3次多項(xiàng)式25點(diǎn)Savitzky-Golay平滑(2nd-3-25SG)三種預(yù)處理。 再使用IBM SPSS Statistics 20 軟件對(duì)光譜數(shù)據(jù)進(jìn)行主成分分析(PCA), 并選擇適當(dāng)主成分因子數(shù)進(jìn)行Fisher判別(FDA)。
為更進(jìn)一步對(duì)OA樣本進(jìn)行早期準(zhǔn)確識(shí)別, 在預(yù)測時(shí)增加樣本的數(shù)量, 僅對(duì)SZ進(jìn)行樣本切片。 OA-3M組中1—6號(hào)切塊; OA-7M組中7—11號(hào)切塊和健康組12—18號(hào)切塊的光譜數(shù)據(jù)(24組數(shù)據(jù))用于OA的分期分析, 其中包括9組健康和15組OA樣本的光譜數(shù)據(jù)。 在PCA-FDA分類處理過程中, 在健康、 OA-3M和OA-7M光譜數(shù)據(jù)中隨機(jī)選擇6, 5和5組(共16組)作為FDA的訓(xùn)練集, 其余8組光譜數(shù)據(jù)作為預(yù)測集進(jìn)行分類識(shí)別。
圖1(a), (b)和(c)分別是經(jīng)BC后的健康和OA樣本(3M, 7M)在不同分區(qū)(SZ, TZ, DZ)的近紅外吸收平均光譜。 可發(fā)現(xiàn), 健康和病變的關(guān)節(jié)軟骨在不同深度下的光譜譜形基本相似且具有相同的特征峰。 其中5 150 cm-1譜帶的主要貢獻(xiàn)來自結(jié)合水和自由水; 4 130~4 460 cm-1特征譜帶主要貢獻(xiàn)來自膠原和蛋白多糖綜合成分; 4 050, 4 610和4 898 cm-1譜帶主要來自膠原蛋白[14]。
圖1 健康和多期病變樣本的SZ(a), TZ(b), DZ(c)的NIR平均光譜圖Fig.1 The near-infrared average spectra of healthy and multi-stage OA tissues at SZ(a), TZ(b), DZ(c), respectively
圖2表示健康和多期病變樣本在不同深度(SZ, TZ, DZ)特征帶吸光度(積分面積)比值: 4 610 cm-1/4 898 cm-1(a)、 復(fù)合帶/4 898 cm-1(b)、 復(fù)合帶/4 610 cm-1(c)。 從圖2(a,b)知: SZ(TZ)中各積分帶比值隨著病變時(shí)間(健康、 OA-3M、 OA-7M)的延長呈下降趨勢(shì); 從圖2(a)和(b)得知, 健康樣本中SZ和TZ的吸光度比值高于OA-3M和OA-7M樣本, 分析認(rèn)為病變初期軟骨中膠原含量幾乎不變, PG含量減少且主要發(fā)生在SZ和TZ[19]。 OA-7M中DZ比值突然升高, 可能是膠原含量不變, DZ中PG修復(fù)合成含量增加所致。 圖2(a)和(b)相似的變化趨勢(shì)證明4 610 cm-1帶可能亦是復(fù)合帶。
圖2 健康和多期病變樣本的4 610 cm-1帶和4 898 cm-1帶(a)、 復(fù)合帶和4 898 cm-1帶(b)、 復(fù)合帶和4 610 cm-1帶(c)在不同深度(SZ, TZ, DZ)的吸光度比Fig.2 The absorbance ratios of the 4 610 to 4 898 cm-1 band (a), the complex to 4 898 cm-1 band (b), the complex to 4 610 cm-1 band (c) of healthy and multi-stage OA tissues at different depths (SZ, TZ, DZ), respectively
進(jìn)一步比較SZ, TZ和DZ的吸光度比值變化趨勢(shì), 發(fā)現(xiàn)圖2(b)中同一病期(健康)的吸光度比值梯度下降比較顯著, OA-3M略有緩和, OA-7M病期的梯度變化則趨于平緩甚至相反, 表明手術(shù)誘發(fā)OA病變后PG含量的變化。 圖2(c)中復(fù)合帶/4 610 cm-1帶的吸光度比值隨分區(qū)深度的變化在健康、 OA-3M和OA-7M中趨于一個(gè)非常接近的斜率, 進(jìn)一步證明4 610 cm-1帶是包含PG成分和膠原蛋白的復(fù)合帶。
上述特征帶吸光度的比值研究, 證實(shí)了4 610 cm-1帶是綜合成分的整體貢獻(xiàn), 而不似文獻(xiàn)[14]所報(bào)道的4 610 cm-1帶僅來源于膠原蛋白的這一說法。 因?yàn)镹IR光譜的吸收帶多是X—H基團(tuán)振動(dòng)的重疊, 所以比較復(fù)雜, 不像MIR特征帶分配定義較為清晰, 易于定量分析。 因此, 仍需將NIR光譜結(jié)合化學(xué)計(jì)量學(xué)方法進(jìn)行進(jìn)一步的定量研究或分期診斷。
圖3為健康和OA樣本SZ位置的NIR光譜數(shù)據(jù)分別BC, 1st-2-21SG, 2nd-3-25SG預(yù)處理后的前3個(gè)主因子的散點(diǎn)圖。 從圖3(a)得知, 經(jīng)BC預(yù)處理和PCA后健康和OA樣本的3個(gè)主因子混合在一起, 無法較好的區(qū)分; 比較圖3(b)和(c)發(fā)現(xiàn), 經(jīng)2nd-3-25SG預(yù)處理和PCA后的樣本主因子混合程度較1st-2-21SG嚴(yán)重。 TZ和DZ的光譜數(shù)據(jù)經(jīng)與SZ相同的預(yù)處理后, 前3個(gè)主因子圖的變化趨勢(shì)與SZ大抵相同。 說明導(dǎo)數(shù)預(yù)處理可以較好地區(qū)分不同類間的差異。 預(yù)處理(BC, 1st-2-21SG, 2nd-3-25SG)后的NIR光譜的SZ, TZ及DZ前3個(gè)主因子的累計(jì)貢獻(xiàn)率均超過85%, 但隨著因子數(shù)的增加, 樣本的正確識(shí)別率上升, 所以本研究選擇固定的前5個(gè)主成分因子(累計(jì)貢獻(xiàn)率均超過90%)進(jìn)行FDA處理。
圖3 健康和OA樣本SZ的NIR光譜數(shù)據(jù)分別經(jīng)BC(a), 1st-2-21SG(b)和2nd-3-25SG(c)預(yù)處理后的前3個(gè)主因子散點(diǎn)圖Fig.3 The scatter plots of the first 3 principal factors on the SZ NIR spectra of healthy and OAtissues with preprocess of BC(a), 1st-2-21SG (b) and 2nd-3-25SG (c), respectively
表2為健康和病變樣本的NIR光譜(SZ 20片、 TZ 21片、 DZ 173片)經(jīng)BC, 1st-2-21SG, 2nd-3-25SG等3種不同預(yù)處理后PCA-FDA的判別結(jié)果, 可分析不同的預(yù)處理方法對(duì)關(guān)節(jié)軟骨分類的影響。 從表2知, SZ的NIR光譜經(jīng)BC預(yù)處理后的初始案例和交叉案例的正確識(shí)別率分別為80%和50%; 經(jīng)1st-2-21SG預(yù)處理后的初始案例和交叉案例的正確識(shí)別率分別為95%和90%; 經(jīng)2nd-3-25SG預(yù)處理后的初始案例和交叉案例的正確識(shí)別率分別是85%和70%。 在樣本TZ中的NIR光譜經(jīng)1st-2-21SG預(yù)處理后正確識(shí)別率為85.7%(初始案例)和85.7%(交互驗(yàn)證案例), 經(jīng)BC預(yù)處理后的初始案例正確識(shí)別率為76.2%和交叉驗(yàn)證的正確識(shí)別率為71.4%。 經(jīng)2nd-3-25SG預(yù)處理后的初始案例和交叉案例的正確識(shí)別率分別為76.2%和42.9%。 在樣本DZ中的NIR光譜經(jīng)1st-2-21SG預(yù)處理后的判別結(jié)果最優(yōu), 正確識(shí)別率也僅有73.8%(初始案例)和71.8%(交互驗(yàn)證案例), BC, 2nd-3-25SG的識(shí)別率更低, 其中初始案例的最高的識(shí)別率才達(dá)到71.3%。
表2 健康和病變樣本的NIR光譜不同預(yù)處理后的Fisher判別結(jié)果
綜上所述, 同一軟骨分區(qū)的NIR光譜經(jīng)3種不同預(yù)處理后, PCA-FDA的初始案例和交叉驗(yàn)證案例的正確識(shí)別率均是經(jīng)1st-2-21SG預(yù)處理后的判別結(jié)果最好, 其中SZ的識(shí)別率高達(dá)95%(初始案例)和90%(交互驗(yàn)證案例)。 1號(hào)切塊50 μm深度的樣本在初始案例和交叉驗(yàn)證中均被誤判到健康組, 誤判的原因可能是該部位基質(zhì)成分并未出現(xiàn)明顯的變化; 3號(hào)切塊100 μm深度的樣本在交叉驗(yàn)證中被誤判到健康組, 可能是由于在OA過程中該部位并未出現(xiàn)明顯的損傷導(dǎo)致誤判。 本研究結(jié)果說明采用一階導(dǎo)數(shù)光譜預(yù)處理可以很好的消除基線偏移, 能凸顯健康和病變的特征, 從而達(dá)到良好的區(qū)分; 基于光譜均作1st-2-21SG預(yù)處理的判別結(jié)果, 可得出, 表層區(qū)的判別結(jié)果優(yōu)于過渡區(qū), 更優(yōu)于深層區(qū)。
表3是SZ, TZ和DZ的NIR光譜數(shù)據(jù)經(jīng)1st-2-21SG預(yù)處理后PCA-FDA顯著性檢驗(yàn)結(jié)果。 Wilk’s Lambda是組內(nèi)的平方和與總平方的比, 范圍從0到1。 Wilk’s Lambda值越低, 說明類間差異就越大[20]。 sig.為顯著性水平假設(shè)檢驗(yàn), sig.值小于0.05, 說明函數(shù)判別顯著。 從表3可知, TZ DZ中sig.的值雖然都小于0.05, 但Wilk’s lambda的值偏大(0.366, 0.772), 類間的差異不明顯, 故DZ的誤判率最高。 由SZ中Wilk’s lambda(0.345)和sig.(0.006)可知: SZ的NIR光譜數(shù)據(jù)經(jīng)1st-2-21SG預(yù)處理后對(duì)健康和病變組織的分類具有很好的辨別能力。 根據(jù)相關(guān)文獻(xiàn)[19,21], OA關(guān)節(jié)軟骨早期病變基質(zhì)成分含量的變化最明顯的區(qū)域就是SZ, 也是最易受損的區(qū)域, 與本研究的結(jié)果分析是一致的。 因此進(jìn)一步選擇SZ的樣本進(jìn)行不同階段的OA分期判別。
表3 SZ, TZ和DZ的NIR光譜數(shù)據(jù)經(jīng)1st-2-21SG后的PCA-FDA顯著性檢驗(yàn)結(jié)果
健康和多期OA軟骨NIR光譜的訓(xùn)練集和預(yù)測集的PCA-FDA結(jié)果如表4所示。 訓(xùn)練集的初始案例識(shí)別率為93.8%和交叉驗(yàn)證識(shí)別率為87.5%; 預(yù)測集的識(shí)別率為87.5%, 其中健康組和OA-7M組樣本是否病變及病變時(shí)期全部被正確識(shí)別, OA-3M組也全被正確識(shí)別為病變樣本, 只是OA-3M組中Y3的5號(hào)切塊、 50 μm深度的樣本切片(預(yù)測集)被誤判到OA-7M組。 出現(xiàn)誤判的原因可能是: 在OA過程中, 由于個(gè)體差異, 預(yù)測集中Y3犬的該部位出現(xiàn)明顯的損傷, 導(dǎo)致誤判; 在初始案例和交叉案例的識(shí)別中, 有同一樣本被誤判(6號(hào)切塊深度為50 μm), 該樣本的存在, 影響了訓(xùn)練集的模型。
表4 健康和多期OA樣本NIR光譜的訓(xùn)練集和預(yù)測集的PCA-FDA(SZ, TZ, DZ)Table 4 PCA-FDA of NIR spectral training and prediction sets ofhealthy and multi-stage OA cartilage (SZ, TZ, DZ)
基于以上結(jié)果, 如果將影響訓(xùn)練集模型的該數(shù)據(jù)移出, 再次做OA分期分析, 發(fā)現(xiàn)訓(xùn)練集的初始案例正確識(shí)別率為100%、 交叉驗(yàn)證正確識(shí)別率為93.3%、 預(yù)測集的正確識(shí)別率為87.5%, 提高了訓(xùn)練集模型的穩(wěn)定性。 在訓(xùn)練集交叉驗(yàn)證判別結(jié)果中OA-3M組Y2犬3號(hào)切塊、 100 μm深度的切片樣本被誤判到健康組, 且在健康和OA分類分析中, 該樣本同樣出現(xiàn)誤判, 出現(xiàn)誤判的原因可能是: 由于ACL手術(shù)3個(gè)月, 處于OA的早期病變, 該部位基質(zhì)成分并未出現(xiàn)明顯的變化。 預(yù)測集健康組和OA-7M組樣本是否病變及病變分期也全部被正確識(shí)別, OA-3M組也全被正確識(shí)別為病變樣本, 同樣是OA-3M組中Y3的5號(hào)切塊50 μm深度的切片樣本被誤判到OA-7M組。
采用1st-2-21SG的NIR光譜預(yù)處理方法結(jié)合PCA-FDA能有效地改善NIR光譜的分析效果, 并能較準(zhǔn)確地對(duì)OA的不同病期進(jìn)行識(shí)別。 僅針對(duì)OA早期病變進(jìn)行初步研究, 為更深入地對(duì)早期OA病變進(jìn)行研究, 需擴(kuò)大樣本數(shù)量, 提高模型的穩(wěn)定性, 提高預(yù)測效果。
采用FTNIR技術(shù)結(jié)合PCA-FDA方法對(duì)比格犬健康和不同病期的OA進(jìn)行研究。 詳細(xì)地探討B(tài)C, 1st-2-21SG和2nd-3-25SG三種不同預(yù)處理方法對(duì)FDA結(jié)果的影響。 發(fā)現(xiàn)經(jīng)1st-2-21SG預(yù)處理后在SZ的判別結(jié)果最優(yōu), 初始案例和交互驗(yàn)證案例的識(shí)別率分別達(dá)到95%和90%; 在OA分期識(shí)別結(jié)果中, 模型的初始案例正確識(shí)別率為100%, 交互驗(yàn)證正確識(shí)別率為93.3%, 預(yù)測集的識(shí)別率為87.5%。 采用NIR光譜的1st-2-21SG預(yù)處理結(jié)合PCA-FDA能有效地改善NIR光譜的分析效果, 較準(zhǔn)確地鑒別關(guān)節(jié)軟骨是否發(fā)生病變, 并能準(zhǔn)確地對(duì)OA的不同病期進(jìn)行判別, 本研究有效實(shí)現(xiàn)了OA的NIR監(jiān)督分類/分期識(shí)別, 為OA的早期原位診斷提供一種臨床可借鑒方法, 對(duì)骨關(guān)節(jié)炎OA的研究、 監(jiān)測和診斷具有重要意義。