admin 管理员组

文章数量: 1086019


2024年5月1日发(作者:python菜鸟教程100例画图)

维普资讯

分子植物育种,2007年,第5卷,第4期,第583—587页 

Molecular Plant Breeding,2007,Vo1.5,No.4,583—587 

新思路、新技术、新方法 

Novel Thinking&Technology 

运用基因组和EST数据库进行电子克隆分离杨树功能基因的策略 

林元震1,2张志毅 

l00038 

林善枝 张谦 刘纯鑫 郭海 

l北京林业大学林木花卉遗传育种教育部重点实验室,北京,100083;2华南农业大学林学院,广州,510642;3水利部水土保持植物中心,北京, 

}通讯作者.zhangzy@bjfu.edu.ca 

摘 要杨树是重要的造林绿化树种,也是主要的工业用材树种,还是高大林木的模式树种。进行杨树功能 

基因的挖掘、克隆和功能的研究,是当前杨树基因组学的首要任务之一,不仅可为杨树品种改良和基因资源 

的有效利用奠定基础,而且对探讨林木的生理及遗传特性分子机制也具有重要的理论意义。电子克隆是近年 

来伴随着基因组计划和EST计划发展起来的基因克隆新方法,具有成本低、速度快、技术要求低和针对性强 

等优点。丰富的杨树EST数据和公布的杨树基因组序列框架图,使得利用电子克隆技术开展杨树功能基因 

的分离和鉴定已经成为可能。本文阐述了电子克隆分离杨树功能基因的基本方法、相关的生物信息资源,并 

讨论了电子克隆技术存在的问题和未来发展。 

关键词 杨树,功能基因,基因组和EST数据库,电子克隆 

Strategies for in silico Cloning Populus Functional Genes Based on Populus 

Genome Sequence and EST Database 

Lin Yuanzhen 。Zhang Zhiyi ’Lin Shanzhi Zhang Qian Liu Chunxin Guo Hai 

1 Key Laboratory for Genetics and Breeding in Forest Trees and Ornamental Plntas,MOE,Beijing Forestry University,Beijing,100083;2 College of 

Forestry,South China Agricultural Universiy,Guangzhou,5 t1 0642;3 Plnta Materials for Soil and Water Conservation,Ministry of Water Resources, 

Beijing,100038 

Corresponding author, ̄angzy@bjfu.edu.ca 

Abstract Poplars are the important tree species for forestation and virescence,as well as for the paper-making 

and timber products,it would be accepted as a model tree in the field of ree science with the development of tplant 

genome research in recent decade.Isolation and identification of the functional genes from poplars is becoming 

one of he tprincipal objectives of Populus genome program,which could help US to make clear the moleculr age— 

netic basis for the poplar genetic improvement and also provide the functional gene resources for transgenic re— 

search.in silico cloning is a kind novel method developed in recent years for functional gene identiifcation by US— 

ng genome aind EST database,There are lots of advantages of in silico cloning,such as low cost,hi gh eficifency

, 

nd easy operation compaared to in lab cloning.With the increasement ofEST data and accomplishment ofPopulus 

genome sequencing,it would become possible and feasible to isolate and identify the functional genes from poplar 

by in silico cloning.In this paper we reviewed the principles of in silico cloning and related bioinformatic re— 

sources,and also dicussed he problems atnd he prospect ofin silitco cloning. 

Keywords Populus,Functional gene,Genome and EST database,in silico cloning 

杨树是世界上分布最广、适应性最强的树种,主 

的主要树种,不仅是用材林中纸浆材的好原料,也适 

要分布在北半球温带和寒温带(北纬22 ̄---70 ̄)。杨树 合于作胶合板材和包装箱材,在工业上起着非常重 

 

是许多国家的重要造林绿化树种,也是生态防护林 

要的作用。杨树具有速生优质,轮伐期短,适应性强,

基金项目:本研究由国家自然科学基金项H(30271093)、国家十一五科技支撑计划专题f2006BAD0lAl5—2) ̄t1)j。 

维普资讯

ss4 B 

繁殖容易,用途广泛等特点,越来越引起人们的重 

索水稻EST库,经过拼接获得了1个886bp的全长 

PCR成功分离了该基因的完整 

视。另外,杨树生长周期短,离体操作容易,基因组相 

cDNA序列,通过RT—

对较小,被喻为林木的“拟南芥”(Taylor,2002)。因 

cDNA克隆,可能编码一个新的锌指蛋白基因。他们 

此,挖掘和克隆杨树功能基因不仅是利用基因工程 

还以玉米全长6一磷酸葡萄糖酸脱氢酶cDNA为查询 

8 kb左右的cDNA序 

技术进行杨树品种改良、有效利用基因资源的基础, 

探针,通过电子克隆获得了1.

PCR克隆了水稻的6一磷酸葡萄糖 

同时,也对研究林木的生理及遗传特性分子机制具 

列,进一步用RT—

黄骥等。2002a)。目前还未见有直接利 

有重要的理论意义。基因克隆的传统方法是采用差 

酸脱氢酶基因(

 

减杂交、原位杂交筛选cDNA文库、mRNA差异显示 

用杨树EST序列拼接获得杨树完整cDNA的报道,

(DDRT)或cDNA末端快速扩增(RACE),这些方法的 

特点是费时费力、花费高、成功率低,所以未得到广 

泛运用。电子克隆“n silic0 cloning)是近年来伴随着 

基因组计划和EST计划发展起来的基因克隆新方 

法,其主要原理是利用日益发展的生物信息学技术, 

借助电子计算机的巨大运算能力,通过EST或基因 

组的序列组装和拼接,再利用RT—PCR快速获得功 

能基因,该方法具有成本低、速度快、技术要求低和 

针对性强等优点(黄骥等,2002b)。 

随着人类、拟南芥、水稻等基因组计划的实施, 

已有研究人员利用电子克隆的方法从人类、水稻等 

中克隆了一些功能基因。目前在GenBank中杨树 

EST数据非常丰富,而且EST数目每天还在高速增 

加。2003年底,美国JGI公司公布了杨树基因组的序 

列框架图,因此,利用生物信息学技术全面开展杨树 

功能基因的分离和鉴定已经成为可能,而且发现新 

的基因及其功能也是当前杨树基因组学的首要任务 

之一。本文阐述了电子克隆分离杨树功能基因的基 

本方法和相关的生物信息资源,并讨论了电子克隆 

技术存在的问题和未来发展。 

1电子克隆分离杨树功能基因的方法 

1.1 EST拼接分离目的基因 

目前电子克隆最常用的方法是利用EST信息进 

行功能基因的分离,大致流程如下:选择目的杨树 

EST或者其他物种尤其是亲缘关系较近的物种全长 

cDNA或EST作为查询探针,通过在线Blast搜索杨 

树dbEST数据库,找到部分重叠的EST并进行拼 

接,再以拼接好的EST重叠群(EST contig)作为新的 

查询探针,继续搜索dbEST库,直到没有新的EST 

可供拼接为止,最后根据拼接好的完整序列设计 

PCR引物,通过RT—PCR获得目的cDNA片段并克 

隆、测序验证(黄骥等,2002b)。 

利用EST进行电子克隆在植物功能基因克隆上 

的运用也是刚刚起步。黄骥等(2002c)以水稻盐胁迫 

cDNA文库1个500 bp的EST S121为信息探针搜 

但有采用其他物种cDNA或者EST作为查询探针 

获得杨树同源基因。张春玲等(2006)以矮牵牛 一 

EXP1 cDNA序列为信息探针,利用杨树EST数据库 

和毛果杨基因组测序结果,通过序列的拼接设计合 

成了基因特异引物,从毛白杨中扩增出一个长为1.0 

kb的全长cDNA,可能与形成层细胞分化相关。我们 

也利用拟南芥的相关EST搜索杨树EST数据库(林 

元震,2006),经拼接组装成全长cDNA序列,并运用 

RT—PCR从甜杨中分离到一些与抗冻相关的功能基 

因,比如SoD(GenBank登记号:DO481231)、ICE1 

(GenBank登记号:DQ481236)、LEA5(GenBank登记 

号:DQ487101)、CBF1(GenBank登记号:DQ487103) 

和ABF2(GenBank登记号:DQ487100)。 

1.2基因组预测、拼接分离目的基因 

2002年2月,开始实施毛果杨基因组的测序计 

划。至2003年底,美国JGI公司宣布毛果杨基因组序 

列草图已经完成,并将测序结果无偿地公布在Internet 

t-(http://genomejgi—ps ̄org/Poptr1/Poptr1.home.htm1), 

全世界的研究人员都可免费下载、公开使用,这必 

将加速杨树功能基因的电子克隆。基因组信息不受 

植物发育时期或特殊环境条件的影响,因此这是利 

用基因组信息进行电子克隆的最大优点。一般流程 

如下:用来源于任何时期或组织的杨树和其他物种 

的EST、全长cDNA序列或氨基酸序列作为信息探 

针,搜索毛果杨基因组序列,通过人工拼接或相应 

的生物信息学软件预测,得到该基因完整的开放读 

码框(ORE),根据拼接的序列结果设计PCR引物,进 

步用RT—PCR获得目的基因的cDNA并克隆、测 

序验证。 

我们利用已分离到的甜杨葡萄糖-6-磷酸脱氢 

酶cDNA片段为探针(林元震等,2006),搜索毛果杨 

基因组数据库,结果找到2个与之高度同源的毛果 

杨相应基因组序列,通过Softberry网站的FGE— 

NESH预测编码框,利用RT—PCR从甜杨中首次克隆 

到了杨树葡萄糖-6-磷酸脱氢酶的全长cDNA,命名 

为PsG6PDH(GenBank登记号:AY445917),经分析 

维普资讯

Strategies for in silico Cloning Populus Functional Genes Based on Populus Genome Sequence and EST Database 

运用基因组和EST数据库进行电子克隆分离杨树功能基因的策略 

585 

表明该基因编码胞质G6PDH,是磷酸戊糖途径的限 

或cDNA编码的蛋白序列去搜索毛果杨基因组,进 

速酶。另外,我们还进一步预测和分析了毛果杨葡萄 

行外显子预测,然后对引物设计区域搜索EST一致 

PCR扩增进行目的 

糖一6一磷酸脱氢酶基因的可能启动子区域,采用 

性序列作为引物,最后利用RT—

PCR从甜杨中分离了一个启动子,序列分析表明含 

基因克隆及序列鉴定。这样可在较大程度上减少 

有TATA box、CAAT box基本元件以及ABA应答 

EST拼接的工作量或者不完整性以及引物设计的简 

元件、抗寒元件等多个逆境胁迫诱导元件。 

1.3结合利用EST数据库和基因组信息 

根据EST数据库或基因组信息进行电子克隆, 

有时会存在一定的局限性和误差性。从EST数据库 

方面来看,EST数据虽然直接代表的是表达序列,在 

电子克隆的拼接中占有非常重要的地位,但有时某 

些EST数据缺乏而无法拼接出完整的cDNA序列; 

对于基因组信息,因为外显子预测大多采用生物信 

息学软件,难免会存在一定的错误。因此,进行电子 

克隆时应该结合EST数据库和基因组信息两个方面 

综合考虑。另外,由于不同物种的功能基因存在同源 

性,即基因序列不完全一致,这样进行EST拼接时或 

基因组序列外显子拼接时,要注意简并性问题,尤其 

是引物设计区域,要充分利用EST信息来寻找一致 

序列作为特异引物设计的模板。一般策略是对于任 

何一个目的序列先进行EST搜索和拼接,无法继续 

拼接后再进行基因组比较和外显子预测,以判断 

EST拼接的完整性。 

另外,相对而言,蛋白质的序列要比核酸序列的 

保守性更高,因此,当以其它物种EST或cDNA为 

信息探针,我们采用的策略(图1)是利用该物种EST 

图1利用杨树EST和基因组数据库进行电子克隆的策略 

Figure 1 Strategy ofin silico cloning by Populus EST and genome 

database 

并性问题。 

2相关生物信息资源 

进行电子克隆时,比较关键的因素有EST数据 

库、基因组信息和相关的生物信息学软件,这三者的 

有机结合能极大地提高该技术的可行性、准确性和 

快速性。表1概括了目前NCBI和PopulusDB收录 

杨树EST情况,可见前者不但量大,而且更新快,后 

表1杨树EST数据库 

Table 1 Populus EST database 

NCBI 数量 

Amount 

Populus trichocarpa 

Populus tremula×P tremuloides 

Populus trichocarpa×P deltoides 

Populus tremula 

Populus trichocarpa x nigra 

Populus nigra 

Populus deltoides 

Populus euphratica 

Populus tremuloides 

Populus×Panescens 

Populus euramer ̄azm 

Populus alba×P tremula val'.g u n 

Populusfremont

3 0 3 3 0 7 1 5 3 6 7 5 0 0 5 舛 

 ̄×R angu

" "

stifol

ia 

:2 M B 叭 7 ● :2鼹 

Populus tomentiglandulosa 

Populus alba×P tremula 

PopulusDB 

Populus 12481 

者则不仅量小,而且更新慢。但两者可结合使用,一 

般策略是当信息探针为非杨树EST时,先到杨树专 

门EST数据库PopulusDB搜索杨树EST,以得到的 

杨树EST作为种子EST,再在NCBI上继续搜索其 

他杨树EST,这样减少搜索工作量。表2列出了与电 

子克隆相关且应用比较广泛的生物信息学资源。其 

中,EST拼接和基因结构分析的软件,大大加快了电 

子克隆的速度。比如Tigem的EST组装机器,用户输 

入目的EST序列,计算机程序自动搜索EST数据库 

并构建EST重叠群,循环搜索,整合成尽可能长的 

EST序列。当电子克隆采用基因组序列信息时,基因 

维普资讯

Populus genome database 

PopulusDB http://poppe1.fysbot.umu.se/ 

杨树EST数据库 

Populus ESTdatabase 

Arabidopsis http://www.arabidopsis.org/ 

拟南芥数据库 

Arabidopsis database 

NCBI 

http://www.ncbi.nlm.nih.gov 

EST数据,Blst等分析 a

ESTdatabase andBlstaanalysis 

Soffberry 

http://www.sottberry.corn/berry.phtml 

各种生物信息预测 

Bioinformatics prediction 

Tigem 

http://www.tigem.it/ESTmachine.html 

EST组装机器 

EST assembling machine 

Place 

http:llwww.dna.affrc.go.jp/PLACE/ 

http://bioinformatics.psb.ugent.be/webtools/plantcare/html/ 

启动子预测 

Promoter prediction 

PlantCare 

启动子预测 

romotPer prediction 

结构分析的软件就比较关键,一般包括外显子预测 的时空特异性,可根据其功能预测或其他物种同源 

和启动子预测。由于不同物种在外显子剪接、启动子 

基因或测定各个时期和不同组织的表达谱而加以判 

序列上存在一定差异,造成不同的程序预测效果也 断;(3)以同源关系较远的蛋白或核酸作为查询探针, 

不尽相同,因此应采用多个程序进行预测并结合实 

可借助基因结构预测软件,使得结构分析变得简单 

际经验综合考虑,确定最有可能的基因结构。目前未 

而且准确。目前,还没有专门用于预测杨树基因组结 

见有专门用于杨树基因组结构的分析软件,不过 

构的软件,我们在利用基因组序列结构分析时,采用 

Soflberry网站的FGENESH,提供了多个物种f人类、 

Soflbery双子叶植物拟南芥的预测系统进行,预测的 

老鼠、果蝇、拟南芥、烟草、水稻、玉米等)的预测功能, 

结果还是比较准确、可信的。美国学者陈宗明实验室 

其中双子叶拟南芥选项可用来预测杨树的基因组结 

(Tuskan et a1.,2006) ̄1J用生物信息学软件预测了毛果 

构,预测结果比较理想,而且预测的准确性高于其他 

杨所有的预期基因,并与拟南芥相比,发现了一些杨 

程序。 

树所特有的新基因,这是个令人兴奋的事情,但目前 

暂停留在预测层次上,还有待于实验的进一步验证。 

电子克隆最初是随着人类基因组和EST计划而 

3电子克隆的问题和展望 

ll and Sanseau,2000),近年来,已成 

与传统基因克隆法相比,电子克隆有很多优点, 

产生和发展的(Gi

但也存在一些问题,比如一些功能基因的保守性比 

功地应用于一些植物物种的功能基因的克隆(林慧贤 

 

较低,EST数据的不完善,从基因组结构预测获得的 

等,2001;黄骥等,2002a;2002c;唐向荣等,2002)。

基因,有时难以获知其表达的时空效应等等。针对这 

2003年底毛果杨基因组序列测序完成及其资料免费 

些问题,黄骥等(2002b)在进行水稻电子克隆策略时, 公开发布,以及日益丰富的杨树EST数据(Sterky et 

提出一些相关的解决方案:(1)根据5’端的起始密码 

a1.,2004),使电子克隆分离杨树基因成为可能,并能 

子AUG的周围序Y ̄J(GCC)GCCA/GCCAUGG规则、 极大加速杨树新基因的发现和功能鉴定研究。可以 

在起始密码子上游的同阅读框序列中是否存在终止 

预期,不久的将来,电子克隆必在杨树基因克隆及其 

密码子和与其他物种同源基因的5’端序列的一致性 

功能研究上发挥越来越重要的作用,甚至成为一种 

比较以及Northern杂交结果判断目的基因转录本的 

必要手段。与传统的基因克隆方法相比,电子克隆主 

大小,这几条原则来获得完整的5’端序列;(2)利用 

要有以下优点:速度快、成本低、技术要求低、常规设 

基因组结构预测获得的基因,往往难以确定其表达 

备即可、针对性强。采用EST进行电子克隆的方法获 

维普资讯


本文标签: 基因 基因组 序列