作者:棘怀庆, 孙俊锋, 雄英, 李宗吉, 王娅娜, 赵巍
【摘要】 目的 应用生物信息学分析软件预测细粒棘球蚴中国大陆株谷胱甘肽s-转移酶(EgGST)氨基酸序列的结构与功能。方法 应用DNAStar、NCBI/BLAST、Biosun、SWISS-MODEL等生物信息学软件分析EgGST的基因序列,推算出其编码的氨基酸序列与其他物种的同源序列,进行多序列同源比对,构建分子进化树;预测二级结构、拓扑结构;同源模建预测三级结构;预测主要抗原表位等。结果 经RT-PCR扩增得到的660bpEgGSTDNA片段,经DNAman分析软件同源性比较发现,与GenBank中检索的EgGST基因序列同源性为99%;EgGST与不同生物间的同源性平均达45%;该基因编码的蛋白分子量为25492.53Da,有219个氨基酸,等电点为7.532,有31个酸性氨基酸,32个碱性氨基酸,52个极性氨基酸和7个非极性氨基酸;有8个抗原表位肽段15G-29R,30E -39C,40S-68R,69G-82Q,83I-90M,91D-120A,121P -133Q,134L-144N。结论 EgGST可能是免疫诊断、药物作用及疫苗潜在的靶分子。
【关键词】 细粒棘球蚴中国大陆株;谷胱甘肽s-转移酶;生物信息学
谷胱甘肽s-转移酶(GST)是一种具有多种生理功能的酶,广泛存在于各种生物体内需氧组织的细胞液中,在从细菌到哺乳动物的细胞内解毒过程中均发挥重要作用。GST 在机体解毒系统及抗感染中发挥重要作用,因此寄生蠕虫的GST 被认为是最具有吸引力的对蠕虫感染有免疫预防和化学治疗的理想目标分子[1]。本文在本课题组已成功构建出重组EgGST的基础上,通过生物信息学方法预测该基因编码蛋白的结构和功能特性,为研究其生物学功能及其在肝包虫的诊断、药物及疫苗的进一步研究提供线索。
1 材料与方法
1.1 材料
细粒棘球蚴中国大陆株重组GST由本实验室成功构建出,其他寄生虫GST氨基酸序列源自GenBank。
1.2 方法
通过DNAStar对重组基因序列进行分析、并推算出其编码的氨基酸序列。
通过NCBI和BLAST在线软件与从GenBank中获取的与EgGSTcDNA序列同源性较高的其他动物GST基因序列进行同源性分析,构建分子进化树。
通过蛋白质分析软件Biosun和DNAStar能够将被测肽链的二级结构(secondary structure)、亲水性参数(hydrophilicity)、抗原性参数(antigenicity)、可塑性参数(flexibility)、表面可能性(Surface Probability)等5种参数综合进行抗原表位的预测。
2 结果
2.1 谷胱甘肽s-转移酶基因开放阅读框基因序列
DNAman 软件对测序后的谷胱甘肽s-转移酶基因序列进行分析,测序结果表明该基因开放阅读框为660bp,基因序列如图1。
2.2 谷胱甘肽s-转移酶基因序列和氨基酸序列的同源性分析
2.2.1谷胱甘肽s-转移酶基因的核苷酸序列的同源性比较 测序结果表明该基因开放阅读框为660bp,经DNAman分析软件同源性比较发现,与GenBank中检索的EgGST基因序列同源性为99%(图2)。仅在第98个碱基处由A变为G,第396个碱基处由A变为T,相应的氨基酸前者由酪氨酸变为半胱氨酸,后者编码的氨基酸未发生改变均为丙氨酸,二者氨基酸的同源性为99%,不同的碱基用阴影加黑标出如图2。
2.2.2 推导氨基酸序列分析及同源性比较 将测序鉴定的目的基因序列推导的氨基酸与NCBI/GenBank上发表的乌拉圭株EgGST氨基酸序列进行比较分析。结果表明推导的谷胱甘肽s-转移酶氨基酸序列是由219个氨基酸残基组成,与已发表氨基酸序列比较有一个氨基酸的差异(阴影加黑标记),同源性达99%(见图3)。
2.2.3 用DNAman 对不同生物谷胱甘肽s-转移酶的氨基酸序列进行同源性比对EgGST与多囊棘球蚴GST(MuLtiple granulosus GST,MgGST)氨基酸同源性为99%,EgGST 与曼氏血吸虫GST(Schinosome mansoni GST,S.mansoniGST)同源性为78%,EgGST与姜片虫GST(Fascila hepatica GST,F.hGST)同源性大于50%(见图4,5)
图5 几种代表性的蠕虫GST的同源进化树
2.3 通过DNAstar和Biosun 软件对谷胱甘肽s-转移酶的二级结构及抗原表位进行预测,SWISSMODEL对蛋白的三维结构进行模拟。
2.3.1 蛋白二级结构的预测(biosun)软件。
2.3.2 Biosun软件对抗原表位肽段的分析(见图6和表1)表1 预测的抗原肽
2.3.3 DANstar 软件对抗原表位肽段及二级结构的预测分析(见图7)图7 EgGST抗原表位及二级结构的分析预测 DNAstar 软件对谷胱甘肽s-转移酶抗原表位肽段的预测结果与Biosun 预测的结果基本符合。对氨基酸序列的分析数据见表2。表2 谷胱甘肽s-转移酶氨基酸序列的分析
3 讨论
随着基因组和功能基因组研究的广泛开展,生物信息学理论和方法也得到了迅猛发展和广泛应用。本实验室于2006年成功克隆出细粒棘球蚴中国大陆株EgGST,并注册到GenBank获得登陆号为:EF 077179。本研究克隆的EgGST基因开放阅读框长度为660bp,推导编码219个氨基酸,其基因序列与Genbank公共数据库检索出的细粒棘球蚴诊断抗原EgGST基因序列的同源性比较发现,它们的基因序列同源性为99%,编码的是同一种蛋白质氨基酸的同源性为99%。此外,我们应用Biosunn、DNAstar蛋白质预测软件及SWISSMODEL在线软件,对EgGST蛋白的抗原表位、二级结构、亲水性、可塑性、抗原指数和三维结构等进行预测和模拟,希望从中搜索尽可能多的关于蛋白质结构与功能的信息,为包虫病的诊断及疫苗的研制提供服务。蛋白质二级结构预测可以作为确定抗原表位的辅助手段。α-螺旋、β-片层结构规则,形态固定,常处于蛋白质内部,难以与抗体嵌合;而转角和无规则卷曲多处于蛋白质表面,结构突出,利于抗体结合,成为抗原表位的可能性极大[2]。亲水性参数分析认为蛋白亲水部位与蛋白抗原位点密切相关。可塑性参数指蛋白抗原构象不是刚性不变的,其多肽骨架有一定程度的活动性和柔韧性,活动性强的氨基酸残基即可塑性大的位点,易形成抗原表位[3]。综合本研究的抗原表位、二级结构等预测结果发现:EgGST蛋白的分子量约为25492.53Da,极性氨基酸数目52个,转角和不规则卷曲二级结构占30%、抗原表位位点8个,亲水性和可塑性较大、抗原性指数较高,这为EgGST有可能成为抗原提供了有力的证据;Biosun预测的抗原表位位点与DNAstar对抗原肽段的预测结果基本符合,提高了预测的可靠性。这些工作为后续选取EgGST中有抗原价值的肽段,制备多肽段联合疫苗提供了线索。
参考文献
[1] 李宗吉,赵嘉庆,赵巍,等,细粒棘球蚴中国大陆株谷胱苷肽S-转移酶基因的克隆和序列分析[J].宁夏医科大学学报,2006,28(1):4-6.
[2] 来鲁华.蛋白质的结构预测与分子设计[M].北京:北京大学出版社,1993:49.
[3] Karplus P A,Schultz G E.Prediction of chain flexibility in proteins[J]. Immunol,1985,72(2):12.