作者:丁淑琴 刘宏鹏 张爱君 张彩芳 赵巍
【摘要】 目的 通过基因序列分析,寻找细粒棘球蚴(Echinococcus granulosus,Eg)热休克蛋白基因(Heat shock protein70,HSP70),为包虫病防治筛选新的候选疫苗抗原。方法 ①登录GenBank公共数据库,检索EgHSP70目的基因序列。②对克隆基因进行测序,结果输入DNAStar、BioSun分析软件和互联网SWISS-MODEL数据库,对重组EgHSP70的特性、抗原表位及构象进行预测分析。结果 ①获得了具有完整开放阅读框的EgHSP70核苷酸序列。②DNAStar分析软件推算氨基酸序列结果显示,EgHSP70由133个理论氨基酸组成,分子量约为14.53kDa。DNAStar、BioSun分析软件确定了重组EgHSP70可能的抗原表位。与其他动物热休克蛋白70氨基酸的同源性分析结果显示EgHSP70具有高度的保守性。结论 生物信息学技术在EgHSP70重组疫苗研究中有一定的理论和应用价值。
【关键词】 生物信息学 细粒棘球蚴 HSP70 重组疫苗
生物信息学(Bioinformatics)是21世纪新兴的生命学科,它是由分子生物与信息科学技术、计算机、物理、数学等学科交叉结合的一门学科。目前,生物信息学发展迅速,与生物实验的联系也越来越紧密。运用生物信息学技术分析一种新基因并对其功能进行预测,已经成为实验研究最常用的方法[1]。本研究利用生物信息学技术在互联网上筛选获得EgHSP70核酸序列,以此作为候选基因设计引物,结合分子生物学方法克隆的EgHSP70基因[2]进行进一步预测分析,希望从中尽可能多地搜索和了解该基因的特性及相关蛋白质结构与功能的信息,为包虫病防治筛选新的候选疫苗抗原提供服务。
1 材料与方法
1.1 材料
1.1.1 分析软件 DNAStar(V5.01),下载网址:http://www.dnastar.com;RasMoLWindows2.7.3,下载网址:http://www.Berns tein-plus-so ns.Com/software/RasMol-2.7.3/;BioSun 2.0 购自于中国军事医学科学院基础医学研究所。
1.1.2 公共数据库 GeneBank公共数据库,网址:http://www.ncbi.nlm.nih.gov/GenBank;Internet/NCBI/BLAST2.26,网址:http://www.ncbi.nlm.nih.gov/blast/,本地服务器运行;Internet/SWISSMODEL/ExPASy Proteomics Serve,网址:http://www.expasy.org/。
1.2 方法
1.2.1 检索获取EgHSP70目的基因片段 登录GenBank公共数据库,输入物种名称—细粒棘球蚴(Echinococcus granulosus)后,通过Entrez Nucleotide来查询已登载的细粒棘球蚴基因序列。通过检索,下载了大量的细粒棘球蚴DNA序列的报告,找到了具有完整的结构基因阅读框的序列100多个,通过相关背景知识资料的调查,选定热休克蛋白70基因做为我们的基因工程疫苗候选基因之一。
1.2.2 理论氨基酸序列同源性分析 将EgHSP70克隆基因的序列资料输入DNAStar的EditSeq分析软件对重组基因的序列进行分析,并推算出其编码的氨基酸序列。将DNAStar推导出的EgHSP70理论氨基酸序列,使用BLAST在线软件(http://www.ncbi.nlm.nih.gov/blast)从GenBank中获取与EgHSP70全序列同源性较高的其他动物(如:科特氏中殖孔绦虫、太平洋牡蛎、马来丝虫、果蝇等)HSP70基因序列进行同源性分析。
1.2.3 重组EgHSP70的抗原表位预测 将EgHSP70克隆基因的序列资料输入DNAStar和BioSun分析软件后分别对二级结构、亲水性、抗原性、可塑性、表面可能性等5种参数进行分析,综合各参数结果后预测分析EgHSP70可能的抗原表位。
1.2.4 重组EgHSP70的空间结构模拟 将EgHSP70全长蛋白序列输入DSGeneAtlas,系统将自动产生提交序列的分析和结构鉴定信息等文件。DSGeneAtlas输出的蛋白结构文件(*.PDB)输入RasMol图形软件,对照模板的三维结构,在RasMol图形窗口中对蛋白进行结构操作,得到相应的图形结构。
2 结果
2.1 EgHSP70原始序列(GenBank序列号:AF450087)
1 gggatggtga atgatgccga gaagttcaaa caagaggatg aaaggcagag ggatcgtgtg
61 gcagccaaga atgggttgga gagctatgcc ttcaccatgc cgtcgacagt ggaagatgag
121 aaggtgaagg ataagataag cgagtcggat cgaaagaaga taacggagag tgtgaagaga
181 cgatcagttg gttggatggg aaccaacagg cggataagga ggagtacgca cagacagaag
241 gagttggaga gtgtgtgcgc aatcccatca tcacgagtgt accaggagcg aggtggtgct
301 ggtggcatgc ctggaggtat gccaggaggc atgcctggtg gtggtggcat gggtggtgcg
361 agttctggtg gccgtggtcc cactattgag gaggttgact aatgcgtttc tgctctgcca
421 ctcgatgatt tccagacacg ttgtatgctt ctcccccctt tctttggtgt aatgtatttg
481 tattttaagt aaagacttac tgtcga
2.2 EgHSP70推导的理论氨基酸序列(即:EgHSP70一级结构)
将EgHSP70克隆基因的序列,输入DNAStar的EditSeq分析软件,推算出其编码的氨基酸序列并分析基本组成。结果显示(见图1),EgHSP70由133个氨基酸组成,分子量约为14.53kD,其中有20个强碱性氨基酸(K,R),27个强酸性氨基酸(D,E),26个疏水性氨基酸(A,I,L,F,W,Y),28个极性氨基酸(N,C,Q,S,T,Y)。
1 MVNDAEKFKQEDERQRDRVAAKNGLESYAFTMKSTVEDEKVKDKISESDRKKITEKCEET 60
61 IKWLDGNQQADKEEYEHRQKELESVCNPIITKMYQEAGGAGGMPGGMPGGMPGGGGMGGA 120
121 SSGGRGPTIEEVD 133
图1 EgHSP70理论氨基酸序列(略)
2.3 EgHSP70的同源性分析
将EgHSP70理论氨基酸序列输入NCBI数据库检索,蛋白BlAST结果显示EgHSP70与HSP70家族所决定的多种蛋白有着较高的同源性。其中,与科特氏中殖孔绦虫(Mesocestoidescorti)的同源性达到78%,太平洋牡蛎(Pacificoyster)69%,马来丝虫(Brugiamalayi)65%,果蝇(Drosophilamelanogaster)61%,斑氏线虫(Wuchereriabancrofti)65%,冈比亚按蚊(Anophelesgambiae)58%。另外,可以看出同源的氨基酸分布在几个相对集中的区域,分别位于1~15、20~35、63~95,具体如图2所示。因而推测这些同源序列区可能为HSP70共同的功能区域。EgHSP701MVNDAEKFKQEDERQRDRVAAKNGLESYAFTMKSTVEDEKVKDKISESDRXXXXXXXXXX60Mesocestoides512MVNDAEKYKQEDDKQRDRVSAKNALESYAFTMKSTVEDEKVKEKIAEGDRKKISEKCEET571Pacific oyster524MVNEAEKYKQEDEKQRERIAAKNGLESYAFNMKSTVDDEKLKDKISEGDKKTILDKCEEI583Brugia malayi517MVQEAEKYKADDEAQKDRIAAKNALESYAFNMKQTIEDEKLKDKISEEDKKKIQEKCDET576Drosophila518MVNEAEKYRNEDEKQKETIAAKNGLESYCFNMKATLDEDNLKTKISDSDRTTILDKCNET577Bancrofti518MVQEAEKYKADDEAQKDRIAAKNALESYAFNMKQTIEDEKLKDKISEEDKKKIQEKCDET577Anopheles533MVNEAEKFRNEDEKQREKISAKNSLEAYCNMKSTMEDANIKDKIPDADKTLIMDKCNAT592** ***** **** ** *** *** ** *EgHSP7061XXWLDGNQQADKEEYEHRQKELESVCNPIITKMYQEA97Mesocestoides572IKWLDANQQADKEEYEHRQKELESVCNPIITKMYQEA608Pacific oyster584IKWMDQNQLADKEEFEHKQKELEGVCNPIITKLYQ618Brugia malayi577VRWLDGNQTAEKDEFEHRQKELESVCNPIITKLYQSA613Drosophila578IKWLDANQLADKEEYEHRQKELEGVCNPIITKLYQGA614Bancrofti578VRWLDGNQTAEKDEFEHRQKELESVCNPIITKLYQSA614Anopheles593IAWLDGNQTAEKEEFEHKQKELEAVCNPIIQKLYQGA629*** ** *** ** ***** * ***** **
图2 HSP70家族蛋白的氨基酸序列同源性比较(略)
2.4 EgHSP70理论蛋白的抗原表位分析
DNAStar和BioSun分析软件预测抗原表位结果见图3、图4(见封4)(略)
由DNAStar分析可知,本研究中表达的重组EgHSP70的二级结构中α-螺旋主要集中于1-22、25-31、35-58、78-86、128-131区段,β-折叠主要集中于91-95、127-128区段,β-转角集中于59-62、64-66、69-76、96-99、104-105、108-109等区段,不规则卷曲集中于21-24、30-34、65-69、74-78、97-103、105-108、109-112区段;相关亲水性分析结果提示亲水区最高区域在EgHSP70N-端的第7-17、36-60、70-81、92-99;抗原性指数分析表明EgHSP70N-端的第15-26、47-52、55-63、66-79、93-101抗原指数较高;可能柔性区域分别为EgHSP70N-端的4-18、21-25、33-61、65-83、88-130;表面可能性区域分析提示于EgHSP70N-端的第8-17、39-58、70-80、92-95区段出现在蛋白质表面的可能性较大。综合评判,提示在EgHSP70N-端的第1-26、33-61、70-83、88-100区段内及其附近区域可能是B细胞表位优势区域。BioSun抗原表位预测结果显示在EgHSP70的132个氨基酸区域内形成了4个主峰(图1)可能是抗原位点,其位置及氨基酸序列从N-端起7-13位氨基酸(LSKREEN);41-47位氨基酸(ADLSVEE);74-80位氨基酸(QKHDGDA);88-94位氨基酸(VREEIER)。
2.5 EgHSP70理论蛋白的空间结构模拟
应用SWISS-MODEL对EgHSP70的推导理论氨基酸序列进行空间结构模拟,部分结果如图5(见封4)。
3 讨论
包虫病(hydatid disease)又称棘球蚴病(Echinococcosis),是世界范围的一种严重危害人民健康的人畜共患寄生虫病,在我国目前已波及25个省、区[3]。宁夏是我国包虫病流行较为严重的省份,据调查资料显示,从1996年到2001年,仅南部山区7县各医院就诊的患者人数就累积达到了941人[4]。
疫苗介入包虫病的预防,既是一种需要,更是一种可能。研究表明,分子疫苗是预防包虫病流行的较理想的方法[5],它应用于包虫病疫苗研制的前景十分乐观。进行重组疫苗的研究,目的基因的筛选和克隆是最为关键的问题,也是后续研究的基础。传统的获取目的基因的做法通过从cDNA文库中筛选或扩增,这种方法首先需要构建一个高质量的cDNA文库。而cDNA文库的构建存在着许多困难,如病原体材料获得的不易;mRNA抽提的质量难以保证;构建文库周期长,并且操作技术繁杂等。利用互联网核酸序列和蛋白质序列数据库资源进行同源性检索,是发现新基因并了解其可能的功能作用的快捷途径。GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了世界各地公开发表的核酸序列,属于一个序列数据库的国际合作组织。它收录有13亿个来自于10 000多种生物的核苷酸序列,而且每天都在及时更新。其中每个记录代表了一个单独的、连续的、带有注释的DNA和RNA片段。在本研究中,我们通过登陆GenBank公共数据库检索细粒棘球蚴虫的编码基因,从检索到的100多个片段中初步筛选出了十几个具有完整阅读框的候选片段。通过对各基因片段的背景资料的分析以及对HSP70的认识,选定EgHSP70为本项研究的目的基因,以此设计引物。再结合分子生物学技术手段扩增目的基因,这种方法较前面提到的从cDNA文库扩增目的基因相比,既节约了构建文库所需的经费,也节省了大量的时间。
本研究还通过互联网上的公共数据库和专业的生物信息分析软件对EgHSP70与其他动物的HSP70进行了同源性分析,抗原表位预测及蛋白质构象的模拟研究。同源性分析的结果分别为:科特氏中殖孔绦虫78%,太平洋牡蛎69%,马来丝虫65%,果蝇61%,斑氏线虫65%,冈比亚按蚊58%,其中同源序列集中于三个肽段,分别位于EgHSP70自N-端的第1~15、21~35、63~95区段,这些区域很有可能就是HSP70的主要功能区。同源区域的预测为HSP70的进化发展和今后深入地研究HSP70功能的作用机制提供一定的参考价值。
疫苗抗原来自各个能诱发保护性免疫而具抗感染效果的抗原蛋白,目前利用各种纯化手段已可获取这些侯选蛋白,但是对于它们的免疫原性位点的精确位置以及其结构与功能的关系所知甚少。病原微生物的抗原分子上存在许许多多的基团,但是决定其活性的只是其中一小部分抗原活性区域,即抗原表位(epitope),它们在免疫应答中起决定性作用。然而,抗原分子的哪部分是其表位?找到一个抗原的表位,就可能研制出针对该抗原乃至该病原生物的疫苗。现代生物信息学的迅猛发展,为我们提供了一种简单、快速的方法,即用计算机预测抗原表位。本研究DNAStar预测出的抗原表位肽段是位于EgHSP70自N-端的第1-26、33-61、70-83、88-100区段,BioSun抗原肽段的预测结果与DNAStar结果基本符合,提高了预测的可靠性。这些肽段位置的确定为以后合成EgHSP70合成肽疫苗的位置选择提供了一个简单和易操作的方法及基本方向。但其效果如何,还有待于通过合成肽分子疫苗的制备及免疫保护性实验来验证。这些预测片段可为今后可能开展的疫苗提供主要参考依据。DNAStar分析软件推算氨基酸序列结果显示,EgHSP70由133个理论氨基酸组成,分子量约为14.53kDa,此结果为后续重组蛋白的表达与纯化提供了可参考的依据。此外,通过SWISSMODEL模拟EgHSP70三维结构,希望从中搜索尽可能多的关于蛋白质结构与功能的信息,为包虫病的诊断及疫苗的研制提供服务。
参考文献
[1] 黄家芳,肖建华,曾桥.运用生物信息学技术分析日本血吸虫Z88基因cDNA序列[J].寄生虫病与感染性疾病,2004,2(2):53-56.
[2] 丁淑琴,赵嘉庆,王娅娜.细粒棘球蚴热休克蛋白70基因的克隆与序列分析[J].宁夏医学杂志,2005,27(8):507-509.
[3] 章家新,傅玉才.包虫病的疫苗研究进展[J].汕头大学医学院学报,2002,15(2):118-120.
[4] 赵瑞,杨玉荣,赵嘉庆.宁夏南部山区包虫病患者的调查分析[J].中国寄生虫病防治杂志,2003,16(2):84-86.
[5] Lightowlers MW.Flisser A,Gauci CG,et al.Vaccination against cysticercosis and hydatid disease[J].Parasitol Today,2000,16:191-196.