隨著科技的進步及信息時代的到來,生物醫(yī)藥領域的文獻呈指數(shù)增長,為醫(yī)學圖書館館員的學科服務工作帶來挑戰(zhàn)。為了給科研工作者提供更加專業(yè)的知識服務(文獻資源、檢索工具等),學科館員應不斷充實專業(yè)知識、提升文獻信息檢索能力、熟悉多種科研分析工具,并對所服務領域的研究有一定了解。PubMed是醫(yī)藥領域使用最多、最具權(quán)威性的數(shù)據(jù)庫之一,也是生物醫(yī)學相關領域科學研究的必備檢索工具之一,但PubMed提供檢索結(jié)果往往缺乏系統(tǒng)歸類和分析功能,給篩選文獻帶來一定困難; Web of Science、F1000等數(shù)據(jù)庫由于費用昂貴,并不能滿足所有醫(yī)學院的信息分析需要。因此,多種基于PubMed的衍生數(shù)據(jù)庫應運而生,如GoPubMed、PubFocus等,它們在一定程度上彌補了PubMed的不足[1]。目前對PubMed及其衍生庫的介紹多集中在對單一數(shù)據(jù)庫的檢索結(jié)果進行粗略的歸納,較少涉及主題內(nèi)容的分析,對了解某課題的研究進展有一定局限。
代謝異常是腫瘤細胞的重要標志,有關腫瘤代謝特征的研究目前擁有廣闊的前景,并得到不斷發(fā)展,有望成為新的殺傷腫瘤細胞的靶點[2]。腫瘤干細胞是指那些在腫瘤細胞中處于相對靜止狀態(tài),但在特定環(huán)境下即可分化為腫瘤細胞的惡性未分化細胞,是腫瘤化療耐藥、復發(fā)、高度侵襲性及轉(zhuǎn)移的重要原因之一,也是近年來腫瘤研究的突破性發(fā)現(xiàn)[3]。與已分化的腫瘤細胞和其他正常干細胞相比,腫瘤干細胞有著完全不同的代謝表型。研究發(fā)現(xiàn)葡萄糖可顯著增加腫瘤干細胞的數(shù)量,是腫瘤干細胞的重要能量來源之一[4],因此研究腫瘤干細胞糖代謝具有重要臨床意義。目前關于腫瘤干細胞糖代謝的研究方興未艾,其代謝特征尚未成為定論。本文以基于PubMed開發(fā)的5種聚類型衍生數(shù)據(jù)庫為檢索工具(GoPubMed、XplorMed、AnneO'Tate、MEDSUM與PubReMiner),分析腫瘤干細胞糖代謝研究主題內(nèi)容,從而深入地了解該領域的研究進展[5]。
以PubMed 收錄的國內(nèi)外腫瘤干細胞糖代謝相關文獻作為研究對象,時間范圍為PubMed所有收錄年,檢索時間截至2016年8月31日;根據(jù)MeSH主題詞及參考文獻中[3,6]涉及的關鍵詞,以“查準”基礎上盡量“查全”的原則構(gòu)建檢索式。腫瘤干細胞:"Neoplastic Stem Cells"[MeSH] OR "cancer stem cells"[All Field] OR "tumor stem cells"[All Field] OR "tumor initiatingcells"[All Field] OR"cancerinitiatingcells"[All Field]OR "Side-Population Cells”[MeSH] OR "stem-liketumorcells”[All Field] OR "stem-likecancer cells"[All Field];糖代謝:"Carbohydrate Metabolism"[MeSH] OR glycometabolism[All Field] OR saccharometabolism[All Field] OR "glucose metabolism"[All Field];“腫瘤干細胞”與“糖代謝”之間采用邏輯與“AND”進行關聯(lián),檢索獲得116篇文獻。
根據(jù)美國國家醫(yī)學圖書館網(wǎng)在2016年(National Network of Liraries of Medicine, NNLM)[5]提供的21個PubMed衍生數(shù)據(jù)庫鏈接,選擇其中網(wǎng)頁穩(wěn)定、能夠識別較為復雜的PubMed檢索式,具有檢索結(jié)果聚類功能、完全免費,無需注冊或登錄,并包含基礎醫(yī)學研究內(nèi)容的數(shù)據(jù)庫如下:AnneO'Tate(http://arrowsmith.psych.uic.edu/cgi-bin/arrowsmith_uic/AnneOTate.cgi)、PubReMiner(http://hgserver2.amc.nl/cgi-bin/miner/miner2.cgi)、XplorMed(http://xplormed.ogic.ca/)、GoPubMed(http://gopubmed.org/web/gopubmed/)與MEDSUM(http://webtools.mf.uni-lj.si/public/medsum.html)。其中,AnneO'Tate是由伊利諾州大學Neil R Smalheiser助理教授與芝加哥大學研究團隊合作研發(fā)的一種基于PubMed數(shù)據(jù)庫的文本挖掘工具,主要對檢索結(jié)果進行歸類,以幫助用戶快速找出最感興趣的文章[7];PubReMiner由阿姆斯特丹大學學術(shù)醫(yī)學中心的Jan Koster博士研發(fā),旨在簡化PubMed檢索結(jié)果,并對檢索結(jié)果進行聚類分析以提供用戶最感興趣的研究熱點[8];XplorMed由加拿大StemCore實驗室的Carolina Perez-Iratxeta教授及其團隊研發(fā)的一種基于MEDLINE數(shù)據(jù)庫的檢索工具,主要功能在于挖掘摘要中的熱門關鍵詞,建立關鍵詞之間的關聯(lián),從而為用戶提供最相關的檢索結(jié)果[9];GoPubMed由德累斯頓工業(yè)大學生物信息學Michael Schroeder教授及其團隊開發(fā),是一種基于MEDLINE數(shù)據(jù)庫的文獻分類工具,同時提供強大的數(shù)據(jù)可視化和交互分析功能,其文獻分類的精準度較高[10];MEDSUM由盧布爾雅那大學生物統(tǒng)計學與醫(yī)學信息學研究所研發(fā),主要為生命科學家提供基于PubMed檢索結(jié)果的分析工具,功能側(cè)重于數(shù)據(jù)歸類與總結(jié)[11]。
由于本文傾向于找出較為前沿的研究內(nèi)容,考慮到MeSH主題詞更新不如關鍵詞快,因此本文選擇利用關鍵詞解讀研究內(nèi)容;將“腫瘤干細胞糖代謝”檢索式輸入各數(shù)據(jù)數(shù)據(jù)庫,重點關注“代謝類型”“代謝酶”“信號通路”與“基因表達”有關的關鍵詞,并對這些重點關鍵詞對應的文獻內(nèi)容進行分析。而各數(shù)據(jù)庫提供的有關期刊排名/類型、作者排名、國家分布等非主題內(nèi)容不進行分析。
由于各PubMed衍生數(shù)據(jù)庫的檢索結(jié)果都在不同程度上提供了主題詞、關鍵詞、主題詞配對、熱門詞組等分析,涉及內(nèi)容較為廣泛。為了與筆者學科服務的工作實際相結(jié)合,選擇與我?;A醫(yī)學院某教研室老師(學科服務對象)較為關心的“代謝類型”“代謝酶”“信號通路”“基因表達”等“重點關鍵詞”進行分析。
在“腫瘤干細胞糖代謝”的檢索式下,5種衍生數(shù)據(jù)庫所提供的主題內(nèi)容相關的關鍵詞以AnneO'Tate最多,MEDSUM最少。其中,MEDSUM提供的只是排名前10的MeSH主題詞,沒有文獻鏈接,無法進一步篩選或了解研究內(nèi)容,故認定重點關鍵詞為0。PubReMiner提供MeSH主題詞的鏈接為該詞匯下的所有檢索結(jié)果,沒有特異性,而篩選的35個重點關鍵詞沒有原文鏈接,無法了解研究內(nèi)容,因此也認定該數(shù)據(jù)庫提供的重點關鍵詞為0。XplorMed首次顯示7個關鍵詞,分別為“細胞”“癌癥”“干性”“腫瘤”“表達”“效應”與“代謝”,每個關鍵詞又分別鏈接與之相關的下位關鍵詞。其中“細胞”的下位關鍵詞最多,共204個;“效應”與“代謝”最少,為11個,且與“細胞”的下位關鍵詞重復。因此將“細胞”選出的31個下位關鍵詞作為重點關鍵詞(表1)。
表1 不同PubMed衍生數(shù)據(jù)庫檢索結(jié)果
從涉及研究對象的重點關鍵詞來看,目前腫瘤干細胞糖代謝的研究主要集中在乳腺癌、惡性神經(jīng)膠質(zhì)瘤、直腸癌、胰腺癌、白血病、卵巢癌、胚胎肉瘤及肺癌;人的實驗約為動物的2倍,其中女性約為男性的3倍;一些人源實驗以已有的腫瘤細胞系為研究對象,根據(jù)GoPubMed的檢索結(jié)果,只有2篇與臨床試驗有關。目前用于鑒定、檢測腫瘤細胞中的腫瘤干細胞標記分子有ac133、CD133、CD44、CD24、CD34,Nanog、Oct4、HIF-1α、Cadherin、C-SRC、MDR1、Lin8的基因的表達變化直接影響腫瘤干細胞多能性,β-Catenin、WNT、SONIC、Hedgehog、SHH、Smad、STAT3及TGF-β則是與腫瘤干細胞生存相關的信號通路。
關于腫瘤干細胞糖代謝的類型,出現(xiàn)頻率較高的重點關鍵詞“Warburg效應”并不是腫瘤干細胞糖代謝具備的特征,而是腫瘤細胞與干細胞(如胚胎干細胞、多能干細胞)的代謝標志。一些研究觀察到腫瘤干細胞以糖酵解為主,也有研究發(fā)現(xiàn)不少腫瘤干細胞更依賴氧化磷酸化,并消耗更多的氧。還有一些腫瘤干細胞利用“有氧糖酵解”代謝方式:一種糖酵解與低水平氧化磷酸化同時存在的糖代謝方式。此外,腫瘤干細胞糖代謝也涉及磷酸戊糖途徑及脂肪酸氧化,而糖異生的研究較少。
XplorMed的關鍵詞包括與糖酵解與氧化磷酸化這兩種代謝有關的催化酶、影響代謝的多種激酶、與催化酶表達相關的信號轉(zhuǎn)導與轉(zhuǎn)錄蛋白及代謝中間產(chǎn)物等,如AMPK、AKT、STAT3、PI3K、己糖激酶、丙酮酸激酶、細胞色素c氧化酶、乙酰輔酶A羧化酶激酶、NADPH激酶、丙酮酸、羥脯氨酸、右旋葡萄糖、腺苷三磷酸。由于糖酵解與氧化磷酸化分別在細胞質(zhì)與線粒體中進行,各自具有不同的耗氧量,因此在對重點關鍵詞的解讀中,筆者發(fā)現(xiàn)腫瘤代謝微環(huán)境(如缺氧狀態(tài)、正常氧狀態(tài))、線粒體的功能(如電子傳遞鏈、活性氧表達水平)、與糖攝取有關的轉(zhuǎn)運蛋白(如ABCG2、Glut1)常常成為研究熱點。
重點關鍵詞中出現(xiàn)的化療藥物常用于檢驗腫瘤細胞在經(jīng)過腫瘤干細胞糖代謝靶向治療后是否恢復藥物敏感性,如紫杉醇、吉西他濱;而“愛卡”(AICAR)及多種激酶抑制劑(如索拉非尼等)可人為改變細胞的脂肪與糖代謝的酶,因此用作腫瘤干細胞糖代謝研究中的干預對照組;雙胍類降糖藥因能抑制三羧酸循環(huán)以及腫瘤干細胞中的腺苷三磷酸(NTPs)而影響腫瘤干細胞功能。此外,還有一類與腫瘤干細胞糖代謝特征有關的重點關鍵詞,主要涉及自噬、代謝重排、異質(zhì)性、上皮間充質(zhì)轉(zhuǎn)換(EMT)及糖基化。
文獻檢索作為科研工作的重要組成部分,是一個不斷篩選、優(yōu)化的過程。本文選用的5種基于PubMed的衍生數(shù)據(jù)庫,其在檢索結(jié)果的歸納分析方面各有千秋,但將它們應用到具體的腫瘤干細胞糖代謝研究,并對主題內(nèi)容進行綜合分析時,筆者還是發(fā)現(xiàn)了一些與前期研究[7-11]不同的使用體驗。
AnneO'Tate的關鍵詞最詳盡,并提供重要的MeSH主題詞配對,有助于研究者在PubMed進行二次檢索時改進檢索式;PubReMiner雖然也提供詳細的主題詞,但無法提供與檢索式相關的文獻鏈接,不適用于本研究;XplorMed對高頻詞匯之間的關聯(lián)與配對比其他數(shù)據(jù)庫更詳細,有助于用戶找到感興趣關鍵詞及其相關文獻,但只能識別PubMed輸出的文檔,而無法直接通過檢索式獲得分析內(nèi)容,因此在檢索結(jié)果的更新上不如其他數(shù)據(jù)庫及時;GoPubMed提供的所有“高度相關概念”都能在“所有相關概念”中找到相關解釋,有助于用戶了解陌生詞匯,對于有摘要的文獻,GoPubMed為用戶提供更加簡潔的文字總結(jié),并將文獻中出現(xiàn)的蛋白質(zhì)產(chǎn)物及其供應商名稱呈現(xiàn)給用戶;MEDSUM提供了研究對象的物種信息、性別比例及年齡分布情況,但只提供排名前10位的主題詞或關鍵詞,并且沒有文獻鏈接功能,同樣不適用于此次研究。因此,本文對腫瘤干細胞糖代謝的主題內(nèi)容分析主要通過AnneO'Tate、GoPubMed與XplorMed這3種衍生數(shù)據(jù)庫獲得(表2)。
表2 不同PubMed衍生數(shù)據(jù)庫功能比較
腫瘤干細胞的名稱較多,MeSH主題詞的表達為“Neoplastic stem cells”,但大量出現(xiàn)在文獻中的表達為“Cancer stem cells, CSCs”(癌癥干細胞)、“Tumor initiating cells, TICs”(腫瘤起始細胞)、“Side population cells, SP”(側(cè)群細胞)、“Stem-like tumor/cancer cells”(多能性腫瘤細胞),甚至是一些特征上的描述,比如“Tumorsphere formation in soft agar”(軟膠成球性腫瘤細胞),或是一些耐放療、耐化療,處于靜止期的細胞。若僅以MeSH主題詞進行檢索將造成漏檢,因此在構(gòu)建檢索式的時候,應根據(jù)檢索目的權(quán)衡“查全”與“查準”原則,并在檢索過程中不斷修改,以獲得最有效的檢索式。
雖然從腫瘤干細胞概念的提出到獲得實驗證實經(jīng)歷了很長時間,但腫瘤干細胞的糖代謝研究仍屬于非常年輕的研究領域。目前關于如何鑒定、分離腫瘤干細胞還存在一定爭議,加之腫瘤干細胞與正常干細胞具有共同的分子標記、活化信號通路、代謝酶等,缺乏嚴格的界定標準,為腫瘤干細胞糖代謝研究帶來困難。近年來有不少研究利用腫瘤干細胞在3D軟膠培養(yǎng)系統(tǒng)中的“成球性”(mammosphere)衡量腫瘤干細胞多能性并獲得認可,因此也將該技術(shù)涉及的研究數(shù)據(jù)納入本文的統(tǒng)計分析中。發(fā)表腫瘤干細胞糖代謝研究結(jié)果的期刊影響因子普遍不高,其中僅《癌癥研究》(CancerResearch,影響因子8.556)與《美國國家科學院院刊》(ProcNatlAcadSciUSA,影響因子9.423)兩種期刊代表了該研究領域目前的最高水平,相關文章數(shù)量不超過10篇,尚未有文章發(fā)表在《柳葉刀》《新英蘭雜志》等權(quán)威的臨床醫(yī)學或轉(zhuǎn)化醫(yī)學期刊上,因此亟待更多的基礎研究闡明腫瘤干細胞糖代謝的作用機制及其可能的藥用靶點。此外,筆者也發(fā)現(xiàn)不少腫瘤干細胞糖代謝的研究結(jié)果彼此差異較大甚至相互矛盾,經(jīng)過進一步文獻發(fā)掘分析發(fā)現(xiàn)這種現(xiàn)象與各文獻記錄的實驗條件不統(tǒng)一有關。有學者認為,為增強研究結(jié)果的精準度與說服力,學術(shù)界對該領域的科研設計要求將更加嚴格,比如研究對象應該以臨床樣本(即外科手術(shù)切除標本)為主,對臨床樣本開展體外培養(yǎng)的時間應限定在原代腫瘤細胞多次傳代培養(yǎng)之前,由此獲得的實驗結(jié)果才更接近患者體內(nèi)的真實情況[12]。
生物醫(yī)學研究飛速發(fā)展,尤其以跨學科、學科交叉研究內(nèi)容增多為顯著特點,單一的文獻數(shù)據(jù)庫已無法滿足科研工作者的文獻需求。本文選用的基于PubMed的聚類性衍生數(shù)據(jù)庫對腫瘤細胞糖代謝研究領域的主題內(nèi)容進行了較為系統(tǒng)的分析,為了解該領域的研究進展提供了較多有價值的信息。在當今大數(shù)據(jù)的時代背景下,各種PubMed衍生數(shù)據(jù)庫的功能都在不斷地完善升級,因此圖書館員應隨時關注這些數(shù)據(jù)庫的更新狀態(tài),并對數(shù)據(jù)庫提供的功能有所選擇,才能充分利用這些數(shù)字資源為科研工作者提供準確而專業(yè)的知識服務,才能提高高校圖書館的學術(shù)活力與競爭力。