【摘要】 多种因素导致的基因差异性表达与疾病的发生发展密切有关,分离差异表达基因,对于研究细胞生命过程的调节机制及致病机制具有重要意义. 20世纪90年代以来,先后出现了mRNA差异显示PCR(mRNA DDRTPCR)、代表性差异分析(RDA)、抑制性消减杂交(SSH)、基因表达连续性分析(SAGE)和DNA微阵列(DNA microarray)等多种分析差别表达基因的方法. 我们对以上方法的原理、基本步骤及其应用进行简要综述.
【关键词】 mRNA差异显示;基因表达;DNA微阵列
0引言
随着各类基因组计划的相继完成,人类面临的更艰巨的任务是研究基因功能活动,也就是说基因组序列分析仅仅代表了遗传信息复杂性的一个层次,而遗传信息有序地、时相地表达则是决定生物体及其行为的另一个层次. 所以,发现不同生物体及其组织在各种状态下(正常状态、发育、衰老、损伤及疾病)差异表达的基因具有十分重要的意义,于是差异表达基因筛选技术应运而生. 目前,基因表达差异的分析通常用稳定状态下mRNA的丰度高低及有无进行比较. 差异表达基因有两个含义,即表达基因的种类变化和基因表达量的变化. 传统的基因分析方法如Northern杂交、斑点杂交等存在费时、费力的缺点,已不适宜进行大规模基因表达分析研究的需要. 因此随着分子生物学的发展,出现了大量新方法,按其技术特点可分为三类:①以杂交为基础的技术,包括Northern blotting,Slmapping/Rnase保护、抑制性消减杂交和DNA微阵列;②以PCR为基础的技术,如差异显示PCR(DDPCR)、代表性差异分析(RDA);③以测序为基础的技术,如表达序列标签(EST)、基因表达连续性分析(SAGE)等. 我们对目前主要的差异表达基因的筛选方法作一综述.
1mRNA差异显示PCR(differential display PCR,DDPCR)
mRNA差异显示PCR又称为差别显示反转录PCR(differential display reverse transcription PCR, DDRTPCR). DDRTPCR技术[1-3]最早于1992年出现,可以用于分离在不同的真核细胞中差异表达的cDNA并加以克隆. 其原理是将两种细胞的mRNA逆转录后进行PCR扩增. PCR 3′端引物序列是针对mRNA的poly(A)尾设计的,一般是11个T再加上两个碱基,这样12种3′端引物(T11AA,T11AC, T11AG,T11AT,T11CA,T11GA,T11CC,T11CG,T11CT,T11GC,T11GG,T T11GT)就可以与所有mRNA的poly(A)尾匹配;5′端引物是随机引物,一般为10个碱基,因此产生一些不同长度的cDNA片段,电泳后比较两者的差别而得到差异表达基因的cDNA. 但这个方法存在许多严重的缺陷,它的5′端随机引物一般常有2~3个碱基不能与cDNA模板完全匹配,而且PCR反应中随机性、偶然性比较大,容易形成非特异性扩增而造成高的假阳性率,这就使下游的筛选工作很巨大. 理论上此方法可以检测到95%以上的转录体,但由于引物序列的随机性和竞争性模板结合位点的存在,很难确定实际的原始RNA丰度. 尽管有上述缺陷,但由于其实验步骤较简单,此方法在实际工作中应用仍较多,例如用于筛选在肿瘤发生、愈伤过程以及胚胎植入过程中起重要作用的基因等.
2代表性差异分析(representational difference analysis,RDA)
RDA[4-8]是Lisitsyn等于l993年在差减杂交的技术基础上发展的分析基因组DNA差异的方法,Hubank等于l994年对其作改良后用于cDNA 的分析. 该技术是将差减杂交与PCR 有机结合形成的一种方法[9], 主要步骤包括:①将对照组(driver)和待测组(tester)mRNA逆转录成cDNA 片段群,接上接头进行第1次PCR扩增;②将tester cDNA和driver cDNA用限制性内切酶酶切,形成平均长度256bp的cDNA;③将接头消化,在tester cDNA 末端接上新的接头,tester cDNA和driver cDNA按1∶100比例混合. 过量的per cDNA可与tester cDNA中互补的部分形成双链;④复性,以新接头为引物进行第2轮PCR. 三种杂合体中只有自身退火形成的tester/tester杂合体才能和引物配对,并以指数形式扩增;tester/driver杂合体只能是线性递增;而driver/driver杂合体则无法扩增. 该方法的主要优点就是能够使差异表达的基因高度富集,重复性较好,假阳性少. 利用RDA人们已经发现了多个新基因. 如白血病凋亡相关基因TFAR19,人乳腺癌相关基因TSPS0等. Arava等[10]利用RDA分析了胰腺β细胞和α细胞,发现26个基因在β细胞中高表达,其中l4个为已知基因,如PKA调节亚基、STAT6等,其余为未知基因,阐明这些未知基因的作用对于了解β细胞的功能及1型糖尿病的发病机制具有重要意义.
3抑制性消减杂交(suppression subtractive hybridization, SSH)
由于RDA或DDPCR在显示低丰度mRNA上存在困难,且需多轮PCR才能完成. Diatchenko等在差减cDNA和RDA的基础上发展了一种基于PCR的SSH[11-14] (suppression subtractive Hybridization, SSH). 该方法同样先将tester与driver的cDNA用限制性酶消化,但整个方法仅用两轮杂交和PCR扩增可完成. 其主要步骤为:①tester cDNA与driver cDNA分别用识别4碱基的限制酶消化产生钝性末端的cDNA 片段;②将tester cDNA分成两份(1和2),分别连上去磷酸化的接头(接头1和接头2)到其5′端;③在第1轮杂交时过量的driver扩增子(amplicon)分别与两份tester扩增子(amplicon)进行杂交,由于高丰度的单链cDNA 与低丰度的单链cDNA大致相等,同时,作为差异表达的靶序列cDNA 相对异源二聚体的非靶序列cDNA 富集效率大得多. 因此,第1轮杂交结束时.差异表达的靶基因便得到大量富集;④在第2轮杂交时,将第1轮杂交后的两样本混合在一起,杂交后补平末端,加入合适引物接头再进行PCR扩增. DNA双链含相同接头时,其PCR扩增受到抑制,而含不同接头的双链DNA分子则获得指数扩增;⑤最终的结果是作为driver cDNA与tester cDNA中相同的部分得到抑制,而在driver cDNA中缺乏而存在的tester cDNA的序列能得到显著的扩增. 此技术避免了消减杂交过程中分离单双链DNA的步骤,可成千倍地扩增目的基因片段,能分离出tester上调表达的基因. 与cDNARDA相比,同样具有假阳性少、重复性强的优点,而在显示低丰度mRNA上具有明显的优势. 该方法不足之处是需要较多的起始材料,而且不能同时进行数个组织/细胞间或不同处理间的比较.
4基因表达连续性分析 (serial analysis of gene expression,SAGE)
SAGE[15-19]是1995年由美国霍普金斯大学医学院Velculescu等[20]发明的一种新的基因表达转录组(transcriptomes)分析技术 . SAGE的基本实验流程如下: ①提取RNA,分离mRNA,以生物素化寡核苷酸(dT)为引物反转录合成cDNA,用限制性内切酶(锚定酶,anchoring enzyme,AE)酶切. 4bp识别位点的限制性内切酶,平均可切割46=256碱基,大多数转录物均大于此范围. 因此,选用4bp识别位点的限制性内切酶可保证每一种转录物上至少有一个酶切位点. 通过链霉抗生物素蛋白磁珠收集mRNA 的polyA尾与最近酶切位点之间的片段;②将cDNA分成两部分,与连接接头A或B进行连接. 接头含有标签酶(tagging enzyme,TE)的酶切位点. 它具有在距识别位点20个碱基位置以外酶切的特点. 接头的结构为引物A/B序列+标签酶识别位点+锚定酶识别位点. 用标签酶酶切产生含有接头约9~10 bp的cDNA片段,收集带有接头A、接头B的酶切片段,用连接酶连接,形成双标签,以引物A和B进行PCR扩增;③用锚定酶酶切PCR产物,用聚丙酰胺凝胶分离双标记序列,并用连接酶构建成多联体. 将多联体克隆进测序载体进行测序分析. 一般每一个克隆最少有10个标签序列. 测序结果用SAGE软件分析,并与GenBank,ESTdatabases等资料库比较分析,得到转录物丰度的数量信息和新的表达基因. SAGE可以分析不同细胞群的基因表达,从而对正常和疾病状态下组织、细胞基因表达做定性和定量分析. 值得一提的是,SAGE对低丰度表达基因有较好检测效果. 此外,还可以利用得到的未知基因转录产物的短序列发现新基因. 缺点是费用昂贵,操作烦琐,结果分析数据庞大.
5DNA微阵列技术(DNA Microarray)
DNA微阵列(DNA Microarray)[21-26],也叫寡核苷酸阵列(Oligonucleitidearray),是人类基因组计划(Human Geneome Project,HGP)的逐步实施和分子生物学的迅猛发展及运用的产物,它是生物学家受到计算机芯片制造和广为应用的启迪,融微电子学、生命科学、计算机科学和光电化学为一体,在原来核酸杂交(Northern、Southern)的基础上发展起来的一项新技术,它是第三次革命(基因组革命)中的主要技术之一,是生物芯片中的一种. 该技术的原理是在固体表面上集成已知序列的基因探针,被测生物细胞或组织中大量标记的核酸序列与上述探针阵列进行杂交,通过检测相应位置杂交探针,实现基因信息的快速检测. DNA微阵列技术的主要流程:①芯片的制备:DNA芯片的制备方法有光引导原位合成法、化学喷射法、接触式点涂法、原位DNA控制合成、非接触微机械印刷法TOPSPOT和软光刻复制等. 目前已能将40万种不同的DNA分子放在1 cm2的芯片上. ②样品的制备:包括样品DNA或RNA的分离提纯和用PCR技术对靶基因片段扩增以及对靶基因标记. ③杂交反应:选择合适的反应条件使生物分子间的反应处于最适反应条件. 芯片杂交属固-液相杂交,影响杂交的有诸多因素,其中包括:靶标浓度、探针浓度、杂交双方的序列组成、盐浓度、温度及洗涤条件. ④芯片信号的检测与分析:样品中靶基因与固定在芯片上的探针发生特异性杂交而结合在芯片上的不同点,荧光素分子受特定波长的激发光照射出特定波长的荧光. 通过特定的扫描仪获取杂交后的信号,目前用于芯片扫描的芯片扫描仪有:激光共聚焦扫描芯片和CCD芯片扫描仪,得到的数据用一个专门处理系统来对其进行处理,包括芯片数据的统计分析和生物学分析、芯片数据库积累和管理、芯片表达基因的国际互联网上检索和表达基因数据库分析等. DNA微阵列技术最突出的特点就是可一次性检测多种样品,获得多种基因的差别表达图谱,已成功地运用cDNA微阵列同时检测l万多个基因的表达. 因此,DNA微阵列是对不同材料中的多个基因表达模式进行平行对比分析的一种高产出的、新的基因分析方法. 与传统研究基因差异表达的方法相比,它具有微型化、快速、准确、灵敏度高,以及在同一芯片上同时大信息量平行检测的优势. DNA微阵列技术在基因表达图谱的绘制、寻找目的基因和功能基因等研究方面已取得了显著的成绩. 但其不足之处在于所点样的序列并不都是试验需要检测的,且试验所需要的分析仪器比较复杂. 另外,DNA微阵列技术在分析低丰度转录体方面比较有限,要确保某种低丰度转录体包含于DNA微阵列上,需挑选非常大量的克隆进行扩增点样. 6结语
随着越来越多的基因被定位、DNA序列被测定及基因组计划的完成,毫无疑问这将给人类提供研究生命奥妙的第一手资料,同时也要求研究方法上有重大突破. 在过去的几年中,高度专业化的工具已越来越多地被应用于基因表达差异的研究. 每种方法都有其独特的优点,如差异显示技术的简单,SAGE的应用广泛性及DNA微阵列的快速、全面. 同样,这些方法也有自己的不足之处. 因此,根据研究目的的不同,选用合适的技术具有十分重要的意义,也可以根据实际要求将多种方法互相融合、联合使用. 大量研究表明,基因表达时、空、量的模式的变化引起了生命过程中细胞的发育和分化、细胞周期的调节、细胞的衰老死亡以及细胞的病理过程. 利用基因差异显示技术发现基因表达的时空模式,将为我们深入探索生命的本质提供十分有力的帮助.
参考文献
[1] Sturtevant J. Applications of differential display reverse transcriptionPCR to molecular pathogenesis and medical mycology[J]. Clinical Microbial Rev,2000,13:408-427.
[2] Steinau M,Unger E,Jones J. Rajeevan M differential display PCR of peripheral blood for biomarker discovery in chronic fatigue syndrome[J]. J Mol Med,2004,82:750-755.
[3] Ripamonte P,Merighe GK,Meirelles FV. Development and optimization of a fluorescent differential display PCR system for studying bovine embryo development in vitro[J]. Genet Mol Res,2005,4(4):726-733.
[4] Hubank M,Bryntesson F,Schatz DG. Cloning of apoptosisrelated genes by representational difference analysis of cDNA[J]. Methods Mol Biol, 2004,282:255-273.
[5] Bowler LD. Representational difference analysis of cDNA[J]. Methods Mol Med,2004,94:49-66.
[6] Sung B, Jung KJ,Chung HY. cDNA representational difference analysis used in the identification of genes related to the aging process in rat kidney[J]. Mech Ageing Dev,2005,126(8):882-891.
[7] Yang JL,LI G,Zhang FL. Identification of variations of gene expression of visceral adipose and renal tissue in type 2 diabetic rats using cDNA representational difference analysis[J]. Chin Med J, 2003,116(4):529-533.
[8] Vorster BJ,Kunert CA. Cullis Use of representational difference analysis for the characterization of sequence differences between date palm varieties[J].Plant Cell Rep, 2002,21:271-275.
[9] Hsieh CM,Yoshizumi M,Endege WO. APEG1,a novel genepreferntially expressed in aortic smooth muscle ceils,is dowmregulated by vascular injury[J].J Biol Chem,l996,271:17354-17359.
[10] Arava Y,Adanisky K,Ezerzer C.Specific gene expression inpancreatic Betacells;cloning and characterization of differentiallyexpressed genes[J].Diabetes,l999,48:552-556.
[11] Shirin M,Sushmita S,Vivek K. Suppression subtractive hybridization coupled with microarray analysis to examine differential expression of genes in virus infected cells Biol[J]. Proced Online, 2004,6(1): 94-104.
[12] Zhang ZZ,Ma ZQ. Suppression subtractive hybridization analysis of Ms2 Nearisogenic lines of wheat reveals genes differentially expressed in Spikelets and Anthers[J]. J Plant Physiol Mol Biol,2005,31(2): 175-182.
[13] Rebrikov DV,Desai SM,Siebert PD. Suppression subtractive hybridization[J]. Methods Mol Biol, 2004,258:107-134.
[14] Zhang Q, Zhang ZW, Xin DQ. Suppression subtractive hybridization for identifying differentially expressed genes in renal cell carcinoma[J]. Chin Med J, 2001, 114(8):807-812.
[15] Boheler KR,Tarasov KV. SAGE analysis to identify embryonic stem cellpredominant transcripts[J]. Methods Mol Biol,2006,329:195-221.
[16] Richards M,Tan SP,Bongso A. Reverse serial analysis of gene expression (SAGE) characterization of orphan SAGE tags from human embryonic stem cells identifies the presence of novel transcripts and antisense transcription of key pluripotency genes[J].Stem Cells,2006,24(5):1162-1173.
[17] Richards M,Tan SP,Tan JH. The transcriptome profile of human embryonic stem cells as defined by SAGE[J]. Stem Cells,2004,22(1):51-64.
[18] Quere R,Manchon L, Lejeune M. Mining SAGE data allows largescale, sensitive screening of antisense transcript expression[J]. Nucleic Acids Res,2004 ,23,32(20):e163.
[19] Keime C,Damiola F,Mouchiroud D. Identitag, a relational database for SAGE tag identification and interspecies comparison of SAGE libraries[J]. BMC Bioinformatics, 2004, 5:143.
[20] Velculescu VE,Zhang L,Vogelstein B.Serial analysis of gene expression[J].Science,1995,270:484-487.
[21] Sjostedt A. A microarray analysis of the murine macrophage response to infection with Francisella tularensis LVS[J].J Med Microbiol,2006,55:1023-1033.
[22] Suzuki T,Tazoe H,Isemura M. DNA microarray analysis of changes in gene expression induced by 1,25dihydroxyvitamin D3 in human promyelocytic leukemia HL60 cells[J]. Biomed Res,2006,27(3):99-109.
[23] Andersson H,Hartmanova B. A microarray analysis of the murine macrophage response to infection with Francisella tularensis LVS[J]. J Med Microbiol, 2006,55(Pt 8):1023-1033.
[24] Peeters JK,Van der Spek PJ. Growing applications and advancements in microarray technology and analysis tools[J]. Cell Biochem Biophys, 2005,43(1):149-166.
[25] Maurer M, Molidor R, Sturn A. MARS: Microarray analysis, retrieval, and storage system[J]. BMC Bioinformatics, 2005, 6: 101.
[26] Qin L,Rueda L,Ali A,et al. Spot detection and image segmentation in DNA microarray data[J]. Appl Bioinformatics,2005,4(1): 1-11.