生物信息学技术在结核分支杆菌ESAT-6重组抗原研究中的应用

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw2023119178 日期:2025-10-27 来源:论文网

     作者:丁淑琴,史彦奎,杨圆圆,杨凤琴

【摘要】   目的 应用生物信息学分析软件预测分析结核分支杆菌ESAT-6基因及相关蛋白的特性。方法 应用NCBI、Expasy等在线生物信息学网站及DNAstar、Rasmol等软件包分析ESAT-6并进行同源比对;预测二级、三级结构,以及预测主要抗原表位等。结果 结核分支杆菌重组抗原ESAT-6与已发表氨基酸序列同源性为90%。预测该蛋白分子质量约为9885.7Da,PI为4.6,4个抗原表位,其结构域位于56-87位。结论 生物信息学技术在结核分支杆菌ESAT-6重组抗原研究中有一定的理论和应用价值。

【关键词】 生物信息学;结核分支杆菌;ESAT-6;重组抗原

  Abstract: Objective To predict the structure and function of recombinant antigen ESAT-6 of Mycobacterium tuberculosis using bioinformatics method. Methods By online analysis at bioinformatics websites such as NCBIhttp://www.nibi.nlm.nih.gov/)and Expasy (http://cn.expasy. org/), and employing software packages such as DNAstar and Rasmol to do multi-sequence homological alignment, secondary structure and tertiary structure,antigenic epitope analysis,etc. Results Compared with the amino acid sequence of ESAT-6 of Mycobacterium tuberculosis published , the homologies was 90%. Analysis of the predicted protein indicated a molecular mass of 9885.7 KDa, PI was 4.6, function sites and four antigen pitope were found. Conclusion Bioinformatic is valuable to the study ESAT-6 of Mycobacterium tuberculosis.

  Key words:bioinformatics; mycobacterium tuberculosis;ESAT-6;recombinant protein

  生物信息学是在生命科学的研究中, 以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一, 同时也是21 世纪包括临床医学在内的自然科学的核心领域之一。对于感染性疾病中病原体、生物传播媒介、宿主的整体基因信息分析, 抗感染药物的设计, 耐药机制的阐明, 疫苗的研发、个体化的预防策略等均有着日益重要的作用[1]。本文通过生物信息学方法对本室已获得的ESAT- 6( 6KDa Early Secretory Antigenic Target)基因进行进一步预测分析,希望从中尽可能多地搜索和了解该基因的特性及相关蛋白的结构与功能的信息,以便为结核病防治筛选新的诊断抗原分子,为实验研究和应用前景分析提供信息。

  1 材料与方法

  1.1 材料

  1.1.1 ESAT-6 DNA序列

  全长基因序列为本实验室从结核分支杆菌标准菌株H37Rv中通过PCR方法获得并亚克隆于pGEM-T中,经BamH I、Xohl I双酶切初步鉴定为阳性克隆菌株送往上海生物工程公司进行核苷酸测序。将克隆基因测序结果输入DNAStar /EditSeq,查找开放阅读框,并对其所编码的氨基酸序列用DNAStar /Protean软件进行分析。

  1.1.2 分析软件

  DNAStar(V5.01),下载网址:http://www.dnastar.com; RasMoL Windows2.7.3,下载网址:http://www.Berns tein-plus-so ns. Com/ software/ RasMol-2.7.3/。

  1.2 方法

  通过NCBI网站(http://www.ncbi.nlm.nih.gov/)ORF finder 以及Prot Param(http://ca.expasy.org/tools/protparam/html)对序列与GenBank中的序列进行在线比对、确定其完整编码序列并预测蛋白质理化性质。通过蛋白质分析专家系统Expasy(http://ca.expasy.org/)所提供的蛋白质组学和序列在线分析工具:PredictProtein (http:cubic.bioc. columbia. edu/predi ctprotein/)预测氨基酸序列的跨膜区和二级结构;通过SMART(http: //smart. embl-heidelberg.de/smart/show_motifs.pl)预测其结构域;通过Mobyle (http://mobyle. pasteur.fr/cgi-bin/portal. py?form= psort)进行亚细胞定位;利用SWISS-MODEL(http://swissmodel.expasy.org/)进行二级三级结构的预测分析,用Rasmol软件包中的三维分子视屏显示。

  2 结果

  2.1 ESAT-6核苷酸及编码的氨基酸序列及理化特性

  ESAT-6基因序列由288个bp组成,编码95个氨基酸,氨基酸序列为:

  MTEQQWNFAGIEAAASAIQGNVTSIHSLLDEG
KQSLTKLAAAWGGSGSEAYQGVQQKWDATATELN
NALQNLARTISEAGQAMASTEGNVAGMFA。用DNAStar软件及ExPASy Protemics Server protparam 预测氨基酸序列的分子质量、等电点、稳定性指数等。综合二者结果如下:ESAT-6分子质量单位为9885.7KDa,理论等电点为4.6,碱性氨基酸残基(Arg+Lys)百分比为4.3%,酸性氨基酸残基(Asp+Glu)百分比为9.5%,在哺乳动物、酵母、大肠埃希菌中的半衰期分别为30h(体外)、>20h(体内)和>10h(体内),不稳定指数为53.37,脂溶性指数为69.05,两亲性指数为-0.359。

  2.2 ESAT-6氨基酸序列的同源性分析

  与NCBI/GenBank上发表的ESAT-6(GenBank序列号:pdb|1WA8|B)氨基酸序列进行比较分析,结果发现同源性为90%(图1)。

  2.3 ESAT-6二级结构预测

  用DNAStar /Protean分析重组蛋白特性及二级结构见图2(封3)。结果显示ESAT-6的二级结构中含有较多的α-螺旋结构(占78%),β-片层、转角(Turn)、无规则卷曲(Coil)依次为1%、5%和16%。

  2.4 ESAT-6的跨膜区域、结构域预测及亚细胞定位

  跨膜区域如图3所示(封3),该蛋白位于细胞外,说明为分泌性蛋白。SMART预测结果显示ESAT-6的结构域位于56-87位(QKWDATATELNNALQNLARTISEAGQAMASTE)。存在于细胞核的可能性为26.1%,在线粒体上存在的可能性为39.1%,在胞浆的可能性为34.8%。

  2.5 ESAT-6的亲水性及疏水性分析

  根据ProtScale软件预测结果(分值越高,其疏水性越强,分值越低,亲水性越强),与跨膜区域的推测结果一致,其疏水性较强。就整体而言,亲水性氨基酸分布在整条链上,为两亲性蛋白,见图4(封3)。

  2.6 ESAT-6的抗原表位肽段的预测

  用Predicting Antigenic Peptides对ESAT-6抗原表位进行预测,结果表明该蛋白有4个抗原位点,见图5(封3),分别为:10-16(GIEAAAS)、18-30(IQGNVTSIHSLLD)、35-41(SLTKLAA)、50-56(AYQGVQQ)。

  2.7 ESAT-6的三维结构预测

  Internet/SW ISSMODEL /EXPASY/ swiss2spdbv37 sp5分析模拟ESAT-6重组蛋白质三维结构见图6(封3)。

  3 讨论

  近年来研究表明,重组蛋白抗原研究是结核病血清学诊断研究的热点。重组蛋白抗原的获得为结核病诊断提供了极大的方便。利用基因工程技术可获得质量更好,纯度更高的蛋白抗原,为结核病血清学诊断方法及蛋白质芯片检测技术的建立奠定了坚实的基础。目前发现的结核分枝杆菌蛋白抗原主要有14KD、16KD、38KD、mtb81和ESAT-6等[2-6]。其中,ESAT-6抗原是早期分泌抗原,是区别结核杆菌和非结核杆菌的最佳候选蛋白抗原,也是目前研究蛋白抗原中较为敏感和特异的一种较为理想的免疫诊断蛋白抗原。

  传统生物学认为,蛋白质的序列决定了它的结构,也就决定了它的功能[7]。蛋白质的功能不仅取决于其氨基酸组成顺序决定的一级结构,在很大程度上生物学活性取决于其高级结构。然而通过实验方法获得蛋白质结构不仅成本高而且速度慢。因此,随着近10年来生物学分子序列信息的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息,用生物信息学的方法,通过计算机模拟相关的辅助信息,可以用较低的成本和较快的时间就能获得可靠的结果[8]。DNAStar软件是一个常用的功能强大的基因和蛋白质综合分析软件。

  本研究中我们利用生物信息学技术对获得的重组ESAT-6基因所编码蛋白分子在一级结构分析的基础上,又进行了蛋白特性及高级结构的初步分析。根据对ESAT-6蛋白氨基酸序列的一、二级结构分析预测, 我们对此新基因有了一定的了解:该基因开放阅读框长度为288bp,推导编码95个氨基酸,分子量约为9885.7Da,理论等电点为4.6,不稳定指数为53.37,脂溶性指数为69.05,两亲性指数为-0.359。同源性比对发现其基因序列与Genbank公共数据库检索出的ESAT-6基因序列的同源性比较发现,它们的基因几乎完全相同(同源性达99%)。提示该蛋白具有较好的遗传学稳定性,适合作为结核病诊断抗原研究的候选分子。一般来说,由于在有机体内部亲水性残基位于表面,因此蛋白质的亲水部位与蛋白质的抗原位点有密切的关系。而无规则卷曲区域除了决定蛋白质的功能外, 与抗原表位也有关[8]。经分析,该序列中α螺旋和无规则卷曲的比例为94%,提示该蛋白有很好的可塑性,可能与其功能有关。SMART预测结果显示ESAT-6的结构域位于56-87位。亚细胞定位表明该蛋白存在于细胞核的可能性为26.1%,在线粒体上存在的可能性为39.1%,在胞浆的可能性为34.8%。综合本研究的亲水性、疏水性、二级结构等预测结果发现:ESAT-6亲水性和可塑性较大、抗原性指数较高,这为ESAT-6抗原表位的确定提供有力的证据。此外,通过专业分析软件明确了ESAT-6蛋白抗原表位位点有4个,抗原表位的肽段序列的确定,为将来进一步开展的结核病诊断血清价值的研究提供理论依据,并为其他蛋白质抗原表位的分析提供了一种可借鉴的手段。ESAT-6重组蛋白的三级结构模拟能够直接提供更多的蛋白质立体构象信息,这对ESAT-6进一步的研究和应用提供很好的线索及数据平台。

  对ESAT-6基因的生物信息学分析为研究该基因的功能和其在诊断、治疗及预防方面的应用价值研究提供了信息。

参考文献


  [1]李大江,刘焱斌,刘 凯.生物信息学在未来感染病学教学中的地位和作用[J].华西医学,2006,21 (3):474-476.

  [2]Verbon A, Hartskeerl RA,Sehttitema A,et al.The 14,000 moleceular-weight antigen of Mycobacterium tuberculosis is related to the alpha-crystallin family of low-molecular-weight heat shock proteins[J].J Bacteriol,1992,174:1352-1359.

  [3]Jacket PS,Bothamley GH,Barta HV,et al.Specificity of antibodes to immunodominant mycobsterial antigens in pulmnonary tuberoulosis[J].J Clin Mierobiol,1988,26:2313-2318.

  [4]Andersen AB,Hansen EB.Structure and mapping of antigentic domains of protein antigen b, 38000-molecular-weight of Myeobacterium tuberculosis[J].Infect Immun,1989,57:2481-2488.

  [5]Arend SM,Engelhord AC,Groot G,et al.Tuberculin skin testing compared with T-cell responses to Myeobectedum tubercufosis specific and noaspecific antigens for detection of latent infection in persons with recent tuberculosis contact[J].Clin Diagn Lab Immunol ,2001, 8: 1089-1096.

  [6]Doherty TM,Demissie A, Olobo J, et al. Immune responses to the Mycobacterium tuberculosis specific antigen ESAT-6 signal subclinical infection arroag contacts of tuberculosis patients[J].J Clin Micmblol, 2002, 40: 704-706.
  
  [7]Clarke R, Ressom HW, Wang A,et al.The properties of high-dimensional data spaces: implications for exploring gene and protein expression data[J]. Nat Rev Cancer,2008,8(1):37-49.

  [8]Elmasri R,Ji F,Fu J,et al. Modeling concepts and database implementation techniques for complex biological data[J].Int J Bioinform Res Appl ,2007,3(3):366-388.

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100