馬汝海,王天驕,潘忠誠(chéng),趙雨杰,何 群*
(中國(guó)醫(yī)科大學(xué)a.公共基礎(chǔ)學(xué)院化學(xué)教研室;b.基礎(chǔ)醫(yī)學(xué)院教育部細(xì)胞生物學(xué)重點(diǎn)實(shí)驗(yàn)室,中國(guó)遼寧沈陽(yáng) 110122)
熱休克轉(zhuǎn)錄因子(heat shock transcription factor,HSF)在熱應(yīng)激反應(yīng)中與熱休克基因相應(yīng)的啟動(dòng)子結(jié)合,啟動(dòng)基因的轉(zhuǎn)錄過(guò)程,最終促進(jìn)熱休克蛋白(heat shock protein,HSP)的表達(dá)。目前發(fā)現(xiàn)HSF 家族有 5 個(gè)成員:HSF1、HSF2、HSF3、HSF4、HSF5;哺乳動(dòng)物體內(nèi)有3種熱休克因子,即HSF1、HSF2 和 HSF4;家禽體內(nèi)有 HSF3[1~3]。
作為熱休克轉(zhuǎn)錄因子家族的成員,HSF4含有高度保守的DNA結(jié)合域[4],除調(diào)控HSP表達(dá)功能以外,也參與細(xì)胞的生長(zhǎng)和分化過(guò)程。比如:HSF4表達(dá)與晶狀體發(fā)育相關(guān),可激活晶狀體上皮細(xì)胞分化,HSF4缺失會(huì)影響晶狀體上皮細(xì)胞熱休克蛋白的表達(dá)[5,6];Hsf4突變與白內(nèi)障發(fā)生相關(guān)[7,8];Hsf4基因缺失會(huì)抑制p53或Arf基因缺陷小鼠自發(fā)性腫瘤的發(fā)展,p53和Arf基因缺陷小鼠敲除Hsf4后其腫瘤圖譜明顯改變,淋巴瘤被顯著抑制[9];Hsf4缺陷細(xì)胞中細(xì)胞衰老與細(xì)胞周期蛋白依賴性激酶抑制劑p21和p27蛋白的表達(dá)增加[10];HSF4通過(guò)調(diào)控RAD51參與DNA損傷修復(fù)[11];在Hsf4基因敲除小鼠中DNA損傷標(biāo)志基因Trx1和Ddit3的表達(dá)異常[5,6];Miles等[12]報(bào)道在SUDHL-4細(xì)胞中,HSF4可與BCL6相互作用,BCL6有調(diào)節(jié)B淋巴細(xì)胞發(fā)育和生長(zhǎng)的功能,最新研究表明BCL6在B細(xì)胞淋巴瘤和其他癌癥的發(fā)病機(jī)制中起著重要作用[13,14]。這些研究結(jié)果提示HSF4參與了細(xì)胞生長(zhǎng)發(fā)育等多種生理、病理過(guò)程,對(duì)HSF4可能調(diào)控的靶基因進(jìn)行系統(tǒng)分析有助于了解HSF4潛在的生物學(xué)功能。因此,我們用染色質(zhì)免疫共沉淀聯(lián)合測(cè)序(chromatin immunoprecipitation sequencing,ChIP-Seq)方法對(duì)肝癌細(xì)胞系SMMC-7721中HSF4可能結(jié)合的靶序列以及可能調(diào)控的靶基因進(jìn)行檢測(cè),對(duì)潛在的靶基因進(jìn)行GO(gene ontology)分析和細(xì)胞傳導(dǎo)通路分析,探討HSF4可能參與的生物學(xué)過(guò)程,并用MEME SUITE軟件對(duì)HSF4與DNA結(jié)合的序列模式進(jìn)行了分析預(yù)測(cè)。
人肝癌SMMC-7721細(xì)胞購(gòu)于中國(guó)科學(xué)院上海細(xì)胞庫(kù),RPMI 1640培養(yǎng)基(含10%胎牛血清)購(gòu)于Gibco公司(USA),所有細(xì)胞置于37℃、5%CO2的培養(yǎng)箱中常規(guī)培養(yǎng)。
染色質(zhì)免疫共沉淀由上??党缮锕咎峁┰噭┖胁f(xié)助完成。細(xì)胞的交聯(lián)和裂解:向細(xì)胞中加入終濃度為1%的甲醛交聯(lián)細(xì)胞,37℃孵育10 min,加甘氨酸至終濃度為0.125 mol/L終止交聯(lián),吸盡培養(yǎng)基,用冰冷的PBS清洗細(xì)胞2次,收集細(xì)胞。加入裂解液和蛋白酶抑制劑復(fù)合物,超聲破碎后將DNA剪切成300~400 bp的片段,分為兩部分,分別加入HSF4(艾博抗上海貿(mào)易有限公司)和IgG(艾博抗上海貿(mào)易有限公司)于4℃過(guò)夜,采用HSF4特異性單克隆抗體(艾博抗上海貿(mào)易有限公司)收集HSF4與DNA結(jié)合的靶序列,磁珠分離,分別用低鹽和高鹽洗滌液、LiCl和TE洗滌液清洗沉淀復(fù)合物,加入洗脫液洗脫,每管中加入終濃度為0.2 mol/L的NaCl于65℃解交聯(lián)過(guò)夜。DNA回收:解交聯(lián)結(jié)束后,加入RNaseA和蛋白酶K處理,用QIAquick Gel Extraction Kit富集收集凝膠回收DNA片段,測(cè)定DNA濃度(Qubit?Fluorometer)。PCR分析驗(yàn)證:采用Actb作為陰性對(duì)照,Hsp70作為陽(yáng)性對(duì)照,Actb-F:5′-CTAGGTCACCCACTAACGCC-3′;Actb-R:5′-GGGCACCTTTTACCCTGGAG-3′;Hsp70-F:5′-CCGCCACTCCCCCTTCCTC-3′;Hsp70-R:5′-CCGCCTTTTCCCTTCTGAGC-3′。加入T4 DNA聚合酶和Klenow polymerase對(duì)DNA進(jìn)行鈍化,在3′加入A末端。采用Illumina’s genomic adapters連接DNA片段,PCR擴(kuò)增,凝膠電泳后用QIAquick Gel Extraction Kit富集收集DNA產(chǎn)物。使用Agilent 1000芯片試劑盒和Agilent 2100 Bioanalyzer驗(yàn)證DNA文庫(kù)質(zhì)量。最后加入0.1 mol/L NaOH產(chǎn)生單鏈DNA分子,按照TruSeq Rapid SBS Kit操作說(shuō)明用Illumina HiSeq 2000進(jìn)行測(cè)序。
生成的序列圖譜及圖像分析結(jié)果提交到OLB V1.8軟件讀取測(cè)序結(jié)果,Solexa CHASTITY過(guò)濾后的數(shù)據(jù)使用BOWTIE software(V2.1.0)與人類基因組(UCSC hg19)進(jìn)行比對(duì),圖譜峰值檢測(cè)采用MACS V1.4.0。
對(duì)啟動(dòng)子區(qū)有HSF4結(jié)合區(qū)域的基因進(jìn)行GO分析(www.geneontology.org),P≤0.05。
根據(jù)KEGG(Kyoto Encyclopaedia of Genes and Genomes)最新數(shù)據(jù),我們對(duì)啟動(dòng)子區(qū)有HSF4結(jié)合區(qū)域的基因進(jìn)行細(xì)胞通路分析(P≤0.05)。
提取與HSF4結(jié)合的啟動(dòng)子區(qū)域的DNA序列,提交到MEME4.12.0(http://meme-suite.org/tools/meme)進(jìn)行模式分析,探討DNA序列與HSF4結(jié)合的序列模式。
將建立的DNA測(cè)序文庫(kù)與hg19數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,使用最新的UCSC RefSeq數(shù)據(jù)庫(kù)進(jìn)行基因注釋。峰值區(qū)域按照最近的TSS被分成五類,即啟動(dòng)子區(qū)域:TSS上下游±2 000 bp;上游區(qū)域:從TSS上游2 000 bp起始最多達(dá)20 000 bp;內(nèi)含子區(qū)域;外顯子區(qū)域;不在上述4個(gè)區(qū)域的DNA集合區(qū)定義為基因間隔區(qū)??偣舶l(fā)現(xiàn)1 726個(gè)HSF4結(jié)合區(qū)域,約55.59%的HSF4結(jié)合區(qū)域位于基因間區(qū),11.54%處于上游區(qū)域,25.57%位于內(nèi)含子區(qū),1.39%位于外顯子區(qū),5.91%位于啟動(dòng)子區(qū)(圖1)。
為了探討HSF4在SMMC-7721細(xì)胞系中發(fā)揮的生物學(xué)功能,我們對(duì)在啟動(dòng)子區(qū)域有HSF4結(jié)合位點(diǎn)的102個(gè)基因序列進(jìn)行聚類分析(GO分析,www.geneontology.org,P≤0.05),結(jié)果如表1和圖2所示。Cellular component(CC)分析結(jié)果共有41個(gè)基因,主要位于細(xì)胞核,部分位于細(xì)胞器,少部分位于細(xì)胞膜;molecular function(MF)分析結(jié)果顯示有18個(gè)基因,主要與核酸蛋白質(zhì)結(jié)合以及蛋白質(zhì)活性相關(guān);biological process(BP)分析結(jié)果顯示有31個(gè)基因,主要參與細(xì)胞增殖、系統(tǒng)發(fā)育、對(duì)化學(xué)藥物以及外來(lái)刺激的反應(yīng)和免疫應(yīng)答過(guò)程,其中一些基因參與了多個(gè)生物學(xué)過(guò)程,隸屬于不同亞項(xiàng)。表1列舉了GO聚類分析中各項(xiàng)目的靶基因數(shù)目,很多基因參與一個(gè)聚類分析中兩個(gè)或更多的亞項(xiàng)。
ChIP-Seq結(jié)果顯示有102個(gè)基因在啟動(dòng)子區(qū)有HSF4結(jié)合區(qū)域,基于最新的KEGG數(shù)據(jù)庫(kù),我們對(duì)這些基因進(jìn)行細(xì)胞通路富集分析,結(jié)果顯示這些HSF4潛在的靶基因主要參與以下細(xì)胞通路:藥物代謝、外源物代謝、化學(xué)致癌、視黃醇代謝、酪氨酸代謝、類固醇激素合成以及催乳激素的信號(hào)轉(zhuǎn)導(dǎo)通路等(圖3)。
目前尚沒(méi)有看到與HSF4結(jié)合的DNA特定基序的有關(guān)報(bào)道,大多數(shù)轉(zhuǎn)錄因子(transcription factor,TF)的數(shù)據(jù)庫(kù)有關(guān)HSF家族結(jié)合基序數(shù)據(jù)多依據(jù)HSF1的基序模式。我們將在啟動(dòng)子區(qū)域與HSF4結(jié)合的DNA序列提交到MEME4.12.0分析軟件,以探討在SMMC-7721細(xì)胞系中HSF4特定的DNA結(jié)合基序,結(jié)果如圖4所示。我們將編碼基因和非編碼基因啟動(dòng)子序列分別進(jìn)行分析,得出6個(gè)分析結(jié)果,編碼基因和非編碼基因各有3個(gè)基序模式,其中編碼基因的啟動(dòng)子基序呈現(xiàn)AG或者CT的聚集簇。
表1 GO分析中參與各個(gè)功能的靶基因數(shù)量Table 1 The number of the target genes participating in GO categories
當(dāng)細(xì)胞受到高溫、毒物、自由基及感染等應(yīng)激原的刺激時(shí),會(huì)發(fā)生一種普遍的防御性適應(yīng)反應(yīng)——熱休克反應(yīng)(heat shock response,HSR)。當(dāng)細(xì)胞受到應(yīng)激性刺激時(shí),細(xì)胞會(huì)通過(guò)HSR誘導(dǎo)熱休克蛋白(heat shock protein,HSP)表達(dá)增強(qiáng),引起基因表達(dá)譜的改變,減輕應(yīng)激性刺激對(duì)細(xì)胞的不良影響。HSP作為一種分子伴侶,在調(diào)控細(xì)胞穩(wěn)定性、提升細(xì)胞存活率方面發(fā)揮重要作用[15]。HSF4是HSF家族的重要成員,其發(fā)現(xiàn)較晚。已有研究顯示,HSF4能啟動(dòng)HSP編碼基因的轉(zhuǎn)錄過(guò)程,促進(jìn)HSP的表達(dá),發(fā)揮耐受不良刺激、保持細(xì)胞完整性等重要適應(yīng)性保護(hù)作用[16]。近來(lái)相關(guān)研究發(fā)現(xiàn),HSF4亦參與與應(yīng)激性刺激無(wú)關(guān)的過(guò)程,例如:參與細(xì)胞周期、細(xì)胞分化,與HSF協(xié)同作用[17,18]。為了探討HSF4在肝癌發(fā)生機(jī)制中所起的作用,我們采用ChIP-Seq方法對(duì)全基因組HSF4與DNA結(jié)合位點(diǎn)進(jìn)行檢測(cè),尋找HSF4可能的靶基因,并對(duì)這些潛在的靶基因進(jìn)行GO分析和細(xì)胞通路分析。分析結(jié)果顯示:這些潛在的靶基因分別參與了藥物代謝、外源性物質(zhì)代謝、化學(xué)致癌、視黃醇代謝、酪氨酸代謝、類固醇激素的合成以及催乳激素的信號(hào)轉(zhuǎn)導(dǎo)通路,參與了細(xì)胞發(fā)育、細(xì)胞增殖、藥物刺激應(yīng)答等多種生物學(xué)過(guò)程,其中多數(shù)基因具有與蛋白質(zhì)或核酸結(jié)合的功能,與蛋白質(zhì)的活性有關(guān)。在這些基因中,有部分基因與腫瘤的形成和細(xì)胞增殖關(guān)系密切,例如,Aldh3a1、Cyp2a6和Zbtb7b。文獻(xiàn)報(bào)道,Aldh3a1在肝細(xì)胞癌中過(guò)表達(dá),可激活Wnt/β信號(hào)傳導(dǎo)通路[19];抑制Aldh3a1表達(dá)可抑制腫瘤細(xì)胞的增殖,在組織再生過(guò)程中ALDH3A1可刺激正常細(xì)胞增殖[20];此外,前列腺癌淋巴結(jié)轉(zhuǎn)移患者中也發(fā)現(xiàn)了Aldh3a1表達(dá)上調(diào)[21]。CYP2A6是細(xì)胞色素P450酶家族的一個(gè)成員,P450是單加氧酶,參與藥物代謝以及膽固醇、類固醇和其他脂類的合成反應(yīng)。Cyp2a6主要在肝臟中表達(dá),參與多種物質(zhì)包括藥物和有毒物質(zhì)的代謝,如尼古丁代謝,并與吸煙引起的疾病密切相關(guān)[22]。Zbtb7b也稱Thpok基因,編碼產(chǎn)物為含有鋅指結(jié)構(gòu)的轉(zhuǎn)錄因子,該轉(zhuǎn)錄因子在未成熟的T細(xì)胞前體細(xì)胞系中起著調(diào)控作用[23],Thpok基因缺失會(huì)導(dǎo)致Cd8基因轉(zhuǎn)錄受到抑制[24],在早期結(jié)腸癌中Thpok起著免疫調(diào)節(jié)作用[25]。所有這些信息提示:HSF4可能通過(guò)調(diào)節(jié)這些潛在的靶基因,在肝癌的形成機(jī)制中發(fā)揮作用。
圖2 GO分析結(jié)果Fig.2 GO analysis map
圖3 啟動(dòng)子區(qū)域有HSF4結(jié)合位點(diǎn)的基因的細(xì)胞通路分析Fig.3 KEGG pathway analysis of genes with HSF4 binding sites in the promoter region
圖4 SMMC-7721細(xì)胞ChIP-Seq實(shí)驗(yàn)中HSF4與DNA結(jié)合位點(diǎn)基序分析結(jié)果Fig.4 Motifs bound by HSF4 in SMMC-7721 cells in ChIP-Seq analysis
轉(zhuǎn)錄因子在基因轉(zhuǎn)錄起始點(diǎn)與特定的DNA序列相結(jié)合,這段DNA片段通常為6~18 bp,轉(zhuǎn)錄因子特異識(shí)別位點(diǎn)的確定一直具有挑戰(zhàn)性。Hsf4的表達(dá)存在組織及細(xì)胞特異性,通常認(rèn)為HSF4參與應(yīng)激反應(yīng)時(shí),胞內(nèi)或胞外的信號(hào)刺激活化HSF4,使HSF4結(jié)構(gòu)改變,暴露DNA結(jié)合域,隨后活化的HSF4識(shí)別并結(jié)合熱休克基因上游的熱休克元件,從而刺激HSP的表達(dá)。
目前,在所有熱休克基因上游均發(fā)現(xiàn)“CTNGAANNTTCNAG”多個(gè)拷貝聚集區(qū)[26],一般認(rèn)為熱應(yīng)答元件(heat response element,HSE)中至少有兩個(gè)或以上的保守五核苷酸序列nGAAn反相交替排列,形成頭-頭(nGAAnnTTCn)和尾-尾(nTTC-nnGAAn)結(jié)構(gòu),為HSF的識(shí)別位點(diǎn)。但是目前有關(guān)人類HSF4與啟動(dòng)子區(qū)結(jié)合的DNA特征序列尚無(wú)報(bào)道,只有HSE啟動(dòng)子區(qū)的順式作用元件(HSE:CGAATTCG)的報(bào)道[27,28]。Jaspar數(shù)據(jù)庫(kù)中有關(guān)HSF結(jié)合motif只有HSF1的相關(guān)記錄:ma0319.1(mouse)[29]和 ma04888886.1(yeast)[30]。ChIP-Seq 是確定轉(zhuǎn)錄因子與DNA結(jié)合區(qū)域的主要手段,但具體的motif還需要進(jìn)一步分析。MEME是一種分析DNA motif的生物信息學(xué)軟件[31],輸入結(jié)合區(qū)域的DNA序列后,通過(guò)富集分析、定位分析和聚類分析可預(yù)測(cè)出潛在的motif。我們將ChIP-Seq結(jié)果中與HSF4結(jié)合的啟動(dòng)子區(qū)域的DNA序列提交給MEME4.12.0軟件,最后得到與HSF4結(jié)合的motif,分析結(jié)果顯示:潛在的靶基因DNA結(jié)合區(qū)域均存在agagag或tctctc聚集模式。
通過(guò)ChIP-Seq和生物信息學(xué)分析,我們對(duì)SMMC-7721細(xì)胞系中HSF4可能調(diào)控的靶基因以及這些靶基因在生物體中可能發(fā)揮的作用和可能參與的生物學(xué)過(guò)程進(jìn)行了分析,并對(duì)HSF4與DNA結(jié)合的序列模式進(jìn)行了預(yù)測(cè),為進(jìn)一步研究HSF4在肝癌形成機(jī)制中所發(fā)揮的作用提供了理論基礎(chǔ)。