作者:生秀梅, 黄新祥, 徐顺高, 张海方, 许化溪
【摘要】 目的: 建立和优化基于伤寒沙门菌全基因组DNA芯片的基因表达谱分析技术。方法: 提取伤寒沙门菌野生z66阳性菌株总RNA,以6,9核苷酸随机引物(N6、N9)和(或)基因组特异引物(GDP)反转录合成cDNA,用荧光素Cy5或Cy3直接掺入标记后,与包括伤寒沙门菌4201个蛋白编码基因的伤寒沙门菌全基因组芯片杂交,用芯片扫描仪扫描后获得表达谱分析结果,经过数据标准化处理后进行分析。结果: 采用N9+GDP混合引物,直接掺入法标记时,既能获得较好标记效果,又能节约试剂成本,同时可减少繁琐步骤所引起的不必要失误。结论: 建立的基于伤寒沙门菌基因组DNA芯片的基因表达谱分析技术,为细菌的基因表达调控及功能基因组学研究提供了平台。
【关键词】 伤寒沙门菌; 基因组; DNA 芯片; 基因表达谱
[Abstract]Objective: To develop and optimize the Salmonella enterica serovar Typhi genomic DNA microarraybased gene expression profiling. Methods: Total RNA of the z66positive wild strains of Salmonella enterica serovar Thypi was extracted and reversetranscribed to cDNA with random hexaoligonucleotide primers(N6), nonaoligonucleotide primers(N9) and genomedirected primers(GDP). During reversetranscription, cDNA was labeled with Cy3dye or Cy5dye directly. The labeled probes were purified and hybridized to a genomic DNA microarrays containing 4201 ORF of S.enterica serovar Typhi. The images were obtained by a laser scanner with two channels and the digital data were analyzed by the Acuity 4.0 software. Results: Using N9+GDP primers and direct labeling methods could not only obtain the excellent expression profiling results, but also cut down the cost of the reagent and avoid the errors caused by the multiple steps. Conclusion: The Salmonella enterica serovar Thypi genomic DNA microarraybased gene expression profiling was developed, which provides a platform for gene transcriptional regulation and functional genomics studies.
[Key words]Salmonella enterica serovar Typhi; genomic DNA microarrays; gene expression profiling
DNA芯片技术是20世纪90年代发展起来的一项新颖的分子生物学技术[1],是各学科交叉综合发展的产物。它以高通量、集约化、大规模、快速平行化等特点,极大地简化和缩短了实验研究进程,目前主要应用于细胞周期、胁迫应答、基因表达调控、基因分型、推测操纵子结构、鉴定毒力因子和遗传药理学研究等方面[2-6]。其中DNA芯片表达谱分析技术是功能基因组研究的热点技术之一[2]。已有很多关于DNA芯片基因表达谱研究的报道,但多集中于真核生物,这是由于真核生物mRNA具有polyA尾,易于获得。原核生物的基因表达谱研究也有报道,但因其mRNA无poly(A)序列等基本特征,只能通过提取总RNA的方式进行相关实验,所以至今没有一个统一的操作方法。
沙门菌属(Salmonella)属于肠杆菌科(Enterobacteriaceae),是研究最为广泛和深入的原核生物之一,其基因组结构及近60%的基因功能已被阐明,目前已成为一种重要的原核生物基因表达与信息调控研究的模式菌[7,8]。本实验室在伤寒沙门菌现有的全基因组序列已知的基础上成功制备了伤寒沙门菌全基因组DNA芯片[9]。本研究将利用此平台建立和优化细菌DNA芯片基因表达谱技术。
常规的DNA芯片基因表达谱分析是通过双色荧光杂交法将参照组和实验组分别用荧光素Cy3和Cy5标记后,与芯片杂交,比较其荧光信号强弱,来获得实验组转录水平上基因表达的差异。整个基因表达谱分析过程比较复杂,包含芯片的制作、RNA的提取、cDNA的合成及荧光素的标记、芯片的杂交与扫描及数据分析等步骤,影响因素众多[10]。因此,本研究利用伤寒沙门菌基因组芯片从RNA的提取、反应体系、RNA用量、反转录酶用量、不同的引物及用量、荧光素用量、cDNA标记及纯化方法、杂交温度及时间等方面对细菌基因表达谱条件进行优化,以期建立实用且最为经济的原核生物基因表达谱技术分析系统。
1 材料和方法
1.1 实验菌株
伤寒沙门菌野生z66阳性菌株,为本实验室保存。
1.2 细菌总RNA的提取
1.2.1 用RNA提取试剂盒(RNaeasy mini column,Qiagen公司)提取
将野生伤寒沙门菌分别于30 ml的含NaCl 300 mmol/L(高渗)或50 mmol/L(低渗)的LB液体培养基中,培养至对数生长期,冰上放置20 min后离心(4 000 r/min,10 min,4 ℃)收集菌体,用TE缓冲液-溶菌酶(0.6 mg/ml, pH 8.0)室温振荡5 min破壁溶菌,用RNaeasy mini column试剂盒,按说明书操作提取细菌总RNA。
1.2.2 用上述试剂盒结合磁珠(MORAEXTRACT,AMR公司,日本)提取
细菌菌体的收集同上,用TE缓冲液-溶菌酶(0.6 mg/ml, pH 8.0)结合磁珠MORAEXTRACT室温振荡5 min破壁溶菌,其余步骤按说明书操作提取细菌总RNA。
两种方法提取的总RNA各取1 μl用核酸检测仪(Nd1000 Spectrophotometer,NanoDrop公司)测浓度及纯度,并取少量于1%琼脂糖凝胶电泳观察质量,通过比较选择所提取RNA质量较好的试剂盒作后续研究用,其提取所得总RNA用DNaseI 消化痕量的DNA后,-70℃保存待用。
1.3 cDNA的荧光标记与纯化
选择直接掺入法标记cDNA,反应体系40 μl。取细菌总RNA 20 μg,用6核苷酸随机引物(N6)9 μg,加DEPC水至19 μl,70℃变性10 min后,冰浴2 min。再依次加入以下成分: 1 μl RNA酶抑制剂(40 U/μl),8 μl 5×缓冲液,4 μl 0.1 mol/L DTT,4 μl 12.5 mmol/L dNTPs,2 μl 1 mmol/L Cy3或Cy5dCTP(Amersham),2 μl反转录酶(200 U/μl,SuperScript III, Invitrogen公司),混匀后在PCR仪(Eppendorf)上进行逆转录反应(25℃10 min,50 ℃4 h,85℃10 min)。在上述反应后溶液中加入10 μl的0.5 mol/L EDTA以终止反应。加入2 μl的5 mol/L NaOH(新鲜,每两周配置一次),65℃保温20 min,以完全裂解RNA。加入2 μl的5 mol/L HCl平衡反应体系。将所得cDNA用PCR纯化试剂盒(QIAquick PCR purification kit,Qiagen公司)纯化,最后用40 μl的水回收,用核酸检测仪(Nd1000 Spectrophotometer,NanoDrop公司)测浓度及纯度,于45℃离心真空干燥,-20℃贮存。
1.4 芯片杂交、漂洗与扫描
于标记cDNA中加入35 μl杂交液,95℃变性10 min后,将杂交液点加于伤寒沙门菌基因组DNA芯片上(本实验室制备)[9],盖上盖片。湿盒中42℃杂交18 h。杂交后芯片于1×SSC,0.06%SDS中洗涤2 min,0.06×SSC中洗涤2 min,95%乙醇中洗涤2 min。吹干后,用GenePix Personal 4100A芯片扫描仪(Axon Instruments公司)扫描芯片。
1.5 实验条件优化
1.5.1 RNA用量的影响
提取不同渗透压条件下的野生z66阳性伤寒沙门菌菌株的RNA,分别做10,20,30,40 μg的RNA双色荧光标记及杂交,以研究不同RNA用量对表达谱技术的影响。其他操作同1.3~1.4。
1.5.2 反转录酶用量的影响
分别取200,300,400,500 U的反转录酶对20 μg RNA进行反转录以确立反转录酶的最佳用量。其他操作同“1.3~1.4”,以荧光信号值减去背景信号值后大于300的数据为有效数据,根据有效数据的数量和强度作为评价标准来确定反转录酶的用量[9]。
1.5.3 不同引物的比较
用FindGDPs软件针对芯片上所有基因3′端50%的序列为靶标设计全基因组特异引物(genome directed primers,GDP)[11],引物长度为6 bp,共设计并合成34条GDP引物,合并所有引物并加入不含RNA酶(RNasefree)的水溶解,总浓度为3 μg/μl。取同一批提取的总RNA 5份,每份20 μg,反转录时分别以N6,N9,GDP,N6+GDP,N9+GDP为引物标记cDNA,其他操作按优化方案进行。
1.5.4 荧光素用量的影响
分别使用1,1.5,2,3 μl 1 mmol/L Cy3或Cy5dCTP(Amersham公司)对20 μg RNA进行反转录标记cDNA以确定荧光素的最佳用量,其他操作按优化方案进行。
1.5.5 反应体系的确定
对20 μg RNA进行反转录标记cDNA,分别使用20,30,40 μl反应体系,按比例加入其他各成分,在节约成本的基础上确定最佳反应体系。具体操作按优化方案进行。
1.5.6 RNA灭活温度的确定
直接法掺入荧光素后,在反应后溶液中加入10 μl的0.5 mol/L EDTA以终止反应。加入2 μl的5 mol/L NaOH(新鲜,每两周配置1次),65℃保温10,15,20 min,以及37℃保温10,15,20 min,以完全裂解RNA,寻找最佳灭活温度。
1.5.7 杂交条件的优化
1.5.7.1 杂交温度
分别将2份20 μg RNA反转录成cDNA,为了减少误差将2份cDNA混合后,平分,进行芯片杂交,杂交温度分别为42℃和50℃,以确定最佳杂交温度,降低非特异性杂交样点。
1.5.7.2 杂交前的预杂交处理
分别将2份20 μgRNA反转录成cDNA,为了减少误差,将2份cDNA混合后平分,进行芯片杂交。其中一份按“1.3~1.4”直接操作,另一份经过预杂交处理,过程如下:加35 μl预杂交液(5×SSC,0.1%SDS,1%BSA),放入杂交箱内50℃预杂交4~6 h。然后将芯片于去离子水中洗涤2次,各2 min。最后于无水乙醇中洗涤2 min,吹干芯片,用于杂交。其他步骤同“1.3~1.4”。
1.5.7.3 杂交时间
按优化方案,分别将5份20 μgRNA反转录成cDNA,为了减少误差,将5份cDNA混合后,再分成5等份,进行芯片杂交。杂交时间分别为9,12,15,18和21 h以确定最佳杂交时间。
1.5.8 数据处理中均一化及阈值的确定
采用软件GenePix Pro 4.1,辅以软件Excel,进行图片处理和数据分析。对同种RNA的双色荧光标记的数据分别进行了中位数、均数和总数3种不同的数据均一化处理,以期确立最佳均一化方案及标记为上调或下调的阈值。
2 结果
2.1 不同RNA试剂盒的比较
Qiagen公司RNaeasy mini column试剂盒结合应用磁珠帮助快速破菌所提取的RNA浓度较高,平均在3 500 ng/μl,其光密度260 nm/230 nm 和260 nm/280 nm比值在2.0左右,电泳观察均有清晰的23S rRNA和16S rRNA条带(图1),而未加磁珠所提取总RNA,其浓度只有1 000 ng/μl左右,RNA易降解。说明该试剂盒结合应用磁珠帮助快速破菌法提取的RNA质量较好,明显优于未加磁珠所提取细菌总RNA。故后续研究中我们将选用RNaeasy mini column试剂盒结合应用磁珠帮助快速破菌法提取细菌总RNA。
2.2 RNA用量的影响
DNA芯片基因表达谱分析中,某个样点的荧光强度越强,说明与该特定的样点杂交的cDNA就越多,意味着该特定基因的mRNA丰度也就越高。本研究分别比较了10,20,30,40 μg RNA的双色荧光标记的芯片杂交效果。结果显示,RNA用量10 μg时杂交信号较弱,20 μg时信号明显增强,增加至30 μg时无明显变化,但增加至40 μg时背景增高,与前人研究结果一致。因此,我们确定后续的研究中RNA用量为20 μg。
2.3 反转录酶用量的影响
30 μl体系中对20 μg的RNA进行反转录时,加入200 U反转录酶信号相对较弱,加入300 U时有效数据明显增多,且强度增大,加入400,500 U的反转录酶时,变化不大,背景略有增高,故综合考虑成本,后续的研究中,反转录酶的用量选300 U。
2.4 不同引物的比较
比较分别以N6,N9,GDP以及N6+GDP,N9+GDP为引物的杂交信号图后,发现N9+GDP等量混合为引物用于RNA的逆转录,能够得到背景相对较低、杂交信号较强的杂交信号图。理论上,GDP引物能对细菌转录本进行选择性标记,提高标记特异性[11]。但实验结果证明,GDP引物减低杂交背景的同时也降低了信号强度;而N6,N9随机引物,能覆盖几乎所有的序列,但也能与除mRNA以外的rRNA和tRNA等互补,从而导致了高的背景值。为了能充分发挥两者各自的优势,最终将两者等量混合用于总RNA的逆转录,结果证明是有效的。
2.5 荧光素用量的影响
以往研究中荧光素(1 mmol/L Cy3或Cy5dCTP,Amersham公司)的用量在40 μl体系对20 μg的RNA进行反转录标记cDNA时达到4.5 μl,荧光素的成本太大。本研究发现30 μl体系中对20 μg RNA进行反转录标记cDNA时,1 μl的1 mmol/L Cy3或Cy5dCTP就能获得较好的荧光信号,且与1.5,2,3 μl的用量所获得的杂交信号区别不大。因此,后续的研究中,30 μl体系中对20 μg RNA进行反转录标记cDNA时,荧光素的用量为1 μl即可,可以极大地降低表达谱成本。
2.6 反应体系的确定
RNA的浓度一般要达到4 000 ng/μl以上才能在保证质量的前提下满足20 μl反应体系的要求,事实上就算使用RNaeasy mini column试剂盒也很难保证每次浓度均在4 000 ng/μl以上。30 μl和40 μl反应体系杂交后荧光信号强度相当,其中30 μl体系中RNA的浓度要求在2 000 ng/μl以上即可,一般均能满足,且相对40 μl体系来说,荧光素、反转录酶的用量均降低了不少,同样可以极大地降低转录谱成本。因此,后续实验中,确定最佳反应体系为30 μl。
2.7 RNA灭活温度的确定
在预备实验中,我们发现65℃保温20 min灭活RNA,会导致荧光素的淬灭,于是选择在65℃条件下保温不同时间,以及选择较为温和的温度37℃保温不同时间来确定最佳灭活RNA的条件,结果显示37℃保温15 min,既能彻底灭活剩余RNA,又不会导致荧光素的淬灭,且能获得较好的杂交效果。因此,确定RNA的灭活温度为37℃,时间为15 min。
2.8 杂交条件的优化
2.8.1 杂交温度
比较相同条件下42℃和50℃的杂交信号图,结果显示42℃~50℃范围内,均能得到较好的杂交效果(信号较强),50℃下杂交的特异性更好。因此,确定杂交温度为50℃。
2.8.2 预杂交
比较进行预杂交和不进行预杂交的芯片杂交信号图,结果显示基因组DNA与芯片杂交时不需要预杂交就能获得较强信号图,但cDNA不经过预杂交过程,直接杂交所得杂交信号较弱,背景较高。这是由于在探针结合前,预杂交能够洗脱掉未结合的DNA,减少与探针杂交的竞争,从而降低背景。因此,在做表达谱实验时需要对芯片进行预杂交。
2.8.3 杂交时间
杂交结果显示,9~18 h内,随着杂交时间的增加,荧光信号值减去背景信号值后大于300的数据(有效数据)的数量和强度均有增加趋势,18 h最好,18 h和21 h的杂交信号强度区别不大。因此,确定杂交时间为18 h。
2.9 数据处理中均一化及阈值的确定
如果直接针对各样点的荧光强度值或比值等进行数据分析,得出的结论可能不可靠。因此,必须将芯片数据进行均一化处理,但至今仍无一种统一的均一化方法[12]。我们使用同一种伤寒沙门菌总RNA(LB低渗培养至对数生长期)分别以Cy3和Cy5dCTP标记,混合、纯化后与芯片杂交,扫描后各样点的荧光强度经数字化转换,以Log2Ratio(635/532)荧光强度比值对Cy3和Cy5的平均荧光强度作图,结果显示:①大多数点的Log2Ratio(635/532)值在-1和1之间,即偏差在一倍以内,不存在显著差异;②离散的点较多集中于荧光强度较小区域(平均荧光强度小于300时),这说明荧光强度较低时,数据可靠性较低,所以我们确定荧光值小于300的属于无效数据,分析时应当舍弃。同时我们比较了中位数、均数和总数3种不同的数据均一(标准)化(normalization)分析方法,发现在分别舍弃了减去背景后Cy5和Cy3值小于300的数据后有2 930个有效数据,即有70%左右的有效样点,其中中位数、均数和总数标准化的Log2Ratio的平均值分别为0.107 691,0.079 967,0.130 790,提示用均数均一化分析最佳,Log2 Ratio值离散度最小。 但我们也发现,即使采用均一法进行校正,Cy3和Cy5双标记还是存在一定偏差。因此,我们提出后续表达谱实验中,应遵循以下几个原则:①配对比较的两种RNA用Cy3和Cy5荧光素交换标记(dyeswap labeling)进行平行杂交;②数据处理时,将Cy3,Cy5信号值皆大于300的作为标定有效基因的标准;③使用均数均一化对原始数据进行均一化;④Log2Ratio(635/532)大于1或小于-1的数据代表的基因存在表达差异[9]。
比较优化前和优化后杂交图(图2),我们可以发现优化后的反应条件既能获得较好的荧光信号强度,又能够最大限度地节约试剂成本,数据统计发现优化后荧光强度比优化前荧光强度平均高近10倍。
优化前扫描图优化后扫描图(图2)。
3 讨论
由于原核生物mRNA无poly(A)序列等基本特征,不易获得,其基因表达谱研究只能通过提取总RNA的方式进行相关实验,至今没有一个统一的操作方法。另外,芯片表达谱实验所需经济成本较高,本研究旨在将试剂成本降低到最低的情况下探索一最佳的细菌基因表达谱优化方案。
有研究提出使用间接标记法即在第一链合成过程中,掺入氨基烯丙基标记的核苷酸即AAdUTP,然后再与Monoreactive Cy荧光素的NHS酯(NHSester)共价结合,能够提高荧光素标记效率。本研究结果显示直接掺入法即反转录的同时掺入荧光素,荧光信号强度与间接法标记法的荧光信号强度差异不大,且间接标记法步骤繁多,费时费力,不如直接法简单易行。故后续的表达谱研究中,我们都将以直接掺入法标记cDNA,这样既能减少操作步骤以降低出错的几率,同时还能够降低试剂成本。
另外,实验设计上,我们也综合考虑到实验条件的一致性和重复性,为了尽可能减少误差,设立各层面的重复,同时对荧光素进行交换标记,这是由于不同的荧光素的标记效率不同,不同荧光素的光敏感性、半衰期不同[10],而且不同扫描仪对不同荧光素的扫描效率也可能有所不同。
优化后条件总结如下:采用双色实验设计配对方法(2×3方案),RNA的提取采用Qiagen公司的RNaeasy mini column试剂盒结合应用磁珠帮助快速破菌法,反应体系为30 μl,细菌总RNA用量20 μg,300 U逆转录酶SuperScript III和1 nmol Cy3(5)dCTP,引物N9和GDP各3 μg,进行逆转录后,预杂交4~6 h,杂交温度为50℃,杂交时间为18 h。数据处理中,我们采用均数均一化,舍弃Cy3,Cy5信号值皆小于300的数据,Log2 Ratio(635/532)大于1或小于-1的数据代表的基因定义为存在表达差异的基因。
DNA芯片作为一种新技术用于基因表达谱研究,其数据的可靠性还需要用另一种手段来验证,国际上常用的是实时定量RTPCR法。通过DNA芯片找出目的基因后,我们还可通过凝胶阻滞实验、足迹法实验、引物延伸实验来寻找确切的作用机制。至此,我们构建了相对稳定、可靠、成熟的基因表达谱分析技术,为后续的基因表达调控研究打下了基础。
参考文献
[1]Fodor SPA, Read JL, Pirrung MC, et al. Lightdirected, spatially addressable parallel chemical synthesis[J]. Science, 1991, 251(4995): 767-773.
[2]Agostini C, Miorin M, Semenzato G. Gene expression profile analysis by DNA microarrays: a new approach to assess functional genomics in diseases[J]. Sarcoidosis Vasc Diffuse Lung Dis, 2002, 19(1):5-9.
[3]Kim MJ, Lim S, Ryu S, et al. Molecular analysis of the Salmonella Typhimurium tdc operon regulation[J]. J Microbiol Biotechnol, 2008,18(6): 1024-1032.
[4]Hinchliffe SJ, Howard SL, Huang YH, et al. The importance of the Rcs phosphorelay in the survival and pathogenesis of the enteropathogenic yersiniae[J]. Microbiology, 2008, 154(4): 1117-1131.
[5]Blixt O, Hoffmann J, Svenson S, et al. Pathogen specific carbohydrate antigen microarrays: a chip for detection of Salmonella Oantigen specific antibodies[J]. Glycoconj J, 2008, 25(1): 27-36.
[6]Batchelor M, Hopkins KL, Liebana E, et al. Development of aminiaturised microarraybased assay for the rapid identification of antimicrobial resistance genes in Gramnegative bacteria[J]. Int J Antimicrob Agents, 2008, 31(5): 440-451.
[7]Salmonella enterica subsp. enterica serovar Typhi Ty2 Complete genome information[DB/OL].[2009-05-09]http:∥www. ncbi. nlm. nih. gov/entrez/query. fcgi?db=genomeprj&&cmd=Retrieve&&dopt=Overview&&list_uids=371.
[8]Everest P, Wain J, Roberts M, et al. The molecular mechanisms of severe typhoid fever[J]. Trends Microbiol, 2001, 9(7): 316-320.
[9]生秀梅, 黄新祥, 茅凌翔, 等. 伤寒沙门菌基因组DNA芯片的制备与基因表达谱分析应用[J]. 生物化学与生物物理进展, 2009, 36(2):206-212.
[10]Zhu T. Global analysis of gene expression using GeneChip microarrays[J]. Curr Opin Plant Biol, 2003, 6(5): 418-425.
[11]Talat AM, Hunter P, Johnston SA. Genomedirected primers for selective labeling of bacterial transcripts for DNA microarray analysis[J]. Nat Biotechnol, 2000, 18(6): 679-682.
[12]周冬生, 杨瑞馥, 宋亚军, 等. DNA 芯片技术在微生物研究中的应用[J].军事医学科学院院刊, 2002, 26(4): 294-300.