基于生物信息学与生物技术开发植物分子标记的研究进展精Word文件下载.docx
《基于生物信息学与生物技术开发植物分子标记的研究进展精Word文件下载.docx》由会员分享,可在线阅读,更多相关《基于生物信息学与生物技术开发植物分子标记的研究进展精Word文件下载.docx(17页珍藏版)》请在冰点文库上搜索。
第一类是以分子杂交为基础的标记技术,主要是RFLP。
第二类是以
PCR反应为基础的一系列分子标记技术,如RAPD、
SCAR、STS和SSR等。
第三类是以酶切和PCR为基础的分子标记技术,主要有AFLP和CAPS等(表1。
近20年来分子标记对植物遗传和育种研究的
发展起到了革命性的作用,其应用涉及到重要性状基因或QTL的定位、遗传图谱的构建、种质资源遗传关系的确定、杂种优势群的划分、比较图谱分析、分子标记辅助选择及图位克隆等多个领域。
本文重点介绍利用生物信息学及分子生物学手段开发分子标记的研究进展。
1利用数据库序列信息和生物信息学手段开
发新的分子标记
随着表达序列标签EST计划的实施及水稻等
模式作物中基因及全长cDNA的克隆,大量的DNA序列信息被储存在公共数据库。
另外拟南芥、水稻等基因组测序工作的完成及其它一些重要生物基因组测序工作的相继开展(Meinkeetal.,1998;
Goffetal.,2002;
Yuetal.,2002;
Timmermansetal.,2004,为利用生物信息学手段开发分子标记提供了大量有益的信息。
通过利用计算机程序,可以从GenBank等数据库中将这些序列下载并识别出其中的SSR、SNP等潜在的多态性位点。
1.1SNP的生物信息学开发
SNP是指基因组内DNA中某一特定核苷酸位置上存在转换、颠换、插入、缺失等变化(Lander,1996。
在遗传学分析中,SNP作为一种遗传标记得以广泛应用,主要源于这几个特点:
(1密度高;
(2遗传稳定性高;
(3易于实现分析的自动化。
目前SNP的
检测技术有多种,
DNA芯片由于具有高度集成化、并行化、多样化、微型化等优点而成为最理想的SNP检测技术(NgandLiu,2006。
生物信息学的SNP挖
掘方法主要是基于
“冗余”数据库。
国际主要的核酸数据库允许不同的机构在任意时间向数据库中提交各种序列,由此造成某一特定区段的序列在数据库中存在多个拷贝,它们可能来源于同一物种不同品系、同种材料不同组织发育时期等,之间存在多态性。
为SNP的开发提供了丰富的资源。
目前应用EST数据库已在人类(Gargetal.,1999;
Picoult-Newbergetal.,1999;
Brumfieldetal.,2003,拟南芥(Schmidetal.,2003、玉米(Usecheetal.,2001;
Batleyetal.,2003等许多生物中进行SNP的开发,在如内含子区、3'
非翻
译区、
BAC末端序列等非编码区的序列是发掘SNP的很好的资源而且其多态性的检测频率是编码区的
表1几种常用标记系统
Table1Someuniversalsystemsofmolecularmarkers标记类型
Typesofmarkers
SingeNucleotidePolymorphismCodingSNP,non-codingSNP
SimpleSequenceRepeat,MicrosatelliteEST-SSRs
RestrictionFragmentLengthPolymorphismRandomAmplifiedPolymorphicDNAAmplifiedFragmentLengthPolymorphismSequenceCharacterizedAmplifiedRegionsCleavedAmplifiedPolymorphicSequence
DerivedCleavedAmplifiedPolymorphicSequenceInter-simplesequencerepeat
Sequence-RelatedAmplifiedPolymorphismTargetRegionAmplifiedPolymorphism
简写
AbbreviationsSNP
cSNP,ncSNPSSRcSSRRFLPRAPDAFLPSCARCAPSdCAPSISSRSRAPTRAP
参考文献References
Lander,1996Lopezetal.,2005Tautz,1989
Varshneyetal.,2005Botsteinetal.,1980Williamsetal.,1990Vosetal.,1995
ParanandMichelmore,1993KoniecznyandAusubel,1993Neffetal.,1998
Zietkiewiczetal.,1994LiandQuiros,2001HuandVick,2003
3倍(Zhuetal.,2003。
Lopez等(2005对木薯分别利用生物信息学方法对EST序列数据库及PCR方法
对非编码区序列在5个栽培种中进行SNP分析,
结果表明:
EST序列中509bp一个SNP;
而在3'
EST和BAC末端序列中62bp出现一个SNP。
Liu等(2007通过对籼稻品种广来10096个全长cDNA的测序并
与基因组数据库粳稻的序列比对发现,由于SNP、
插入缺失等序列多态性而引起45.8%的氨基酸水平替换。
由于SNP的特点,利用它可以构建出非常精细的遗传图谱;
在GenBank(www.ncbi.nlm.nih.gov的SNP数据库中,400万的水稻SNP已被定位到水稻基因组(Liangetal.,2008。
1.2微卫星标记的生物信息学开发
SSR标记因其重现性好、可检测位点多、共显性且均匀覆盖整个基因组等优点成为育种家和遗传学家研究的有效工具。
由序列信息开发SSR主要从BAC末端、基因间序列等非编码序列及从EST等编码序列中开发,前者称为基因组SSR,具有更高的多态性而在区分关系相近的基因型时更加有效;
后者
称为EST-SSRs,
来自转录本的特性赋予了其更高的价值:
通过同源性检索可以推断其功能;
可用于对自然群体和种质收集的功能多样性分析;
高水平的可转移性使之在比较定位和进化研究中可作为锚定标记。
1.2.1EST-SSRs的识别、频率及分布
Morgante与Olivieri早在1993年就开发对植物EST-SSRs进行鉴定。
然而当时可利用的公共序列数据非常有限(<
5000kb。
在单子叶植物及双子叶植物中鉴定率分别只达到64.6kb和21.2kb一个EST-SSRs。
随后,EST计划的实施产生了大量序列
TheProgressofDevelopmentforPlantMolecularMarkersBasedonBioinformaticsandBiotechnology
131
分子植物育种
MolecularPlantBreeding
www.molplantbreed.org
推动了基因内SSRs的识别。
Varshney等(2005估计
了大麦75.2Mb、
玉米54.7Mb、水稻43.9Mb、黑麦3.7Mb、高粱41.6Mb和小麦37.5Mb的表达区域SSR密度,平均覆盖率为6.0kb一个SSR。
然而,Morgante等(2002在水稻、玉米和小麦中报道了分别为2.1kb、1.1kb、1.3kb的更高的SSRs频率。
值得注意的是由于在识别SSRs的标准上的差异导致SSRs的频率及不同长度、不同重复单位的出现频率在不同研究中差异较大。
最常见的为3个核苷形成的重复(trinucleotide
repeats,TNRs,
其次是2个核苷(dinucleotiderepeats,DNRs或4个核苷形成的重复(tetranucleotiderepeats,TTNRs。
Varshney等(2005研究发现在禾本科作物EST数据库中TNR出现频率最高,为54%~78%;
DNR和TTNR则分别为17.1%~40.4%和3%~6%。
不同重复模体的频率和分布在不同研究中均有差异:
小麦中TNRs变化为49%~83%,DNRs与TTNRs的出现频率在不同研究中则变化不大(Kantetyetal.,2002;
Morganteetal.,2002。
1.2.2多态性水平
由于转录区的DNA序列保守性较强,EST-SSRs的多态性一般低于基因组SSR。
然而最近在对猕猴桃EST-SSRs进行发掘并定位时发现,其中93.5%具有多态性而且在种内杂交产生的群体中有分离。
另外,3'
非翻译区EST-SSRs的多态生检测率高于5'
非翻译区。
Scott等(2000发现来自不同区域的EST-SSRs的其多态性有所差异,3'
UTR的EST-SSRs在栽培种间具有最高的多态性;
5'
UTR的EST-SSRs在不同的种间具有最高的多态性;
而编码区的EST-SSRs在不同的属间具有最高的多态性。
胥猛和李火根(2008通过对6520条鹅掌楸EST序列进行检索,在364条ESTs中发现394个SSRs,鹅掌楸EST-SSRs平均密度为每8.5kb含有1个SSR;
其中二核苷酸重复单元的SSRs类型最多,占总数的61.9%。
利用SSR-ESTs序列共设计176对EST-SSR引物,扩增后多态性引物占36.9%。
这批EST-SSR引物具有较高
通用性,
85%在中国马褂木中有扩增,54%在白玉兰中有扩增。
EST-SSRs的开发对于比较作图来讲非常重要。
一个可以在不同的物种中扩增出同源位点的EST-SSRs引物数据库对育种家和遗传学家来讲非常有用,尤其是对小而资金不足的作物更是如此,因为它们位于基因编码区,具有很强的保守性。
2利用分子生物学实验技术开发新的分子标记
从实验室开发新的分子标记方式来讲可将其分
为3类:
第一种包括RAPD、SSR、AFLP、SRAP等,因
其具有共同点,即不需要预知DNA序列信息、
检测位点随机性强而将其称为非特异性标记;
第二种主要包括FLP、SSR、SCAR、CAPS等,其特点是预先需
了解DNA序列信息以制备探针或设计引物、
检测位点特异性高,在此将其称为特异性标记,它们的开发主要从感兴趣的非特异性标记转换而来;
另一种则是根据已知序列设计特异的单侧引物与另一侧用非特异性引物组合扩增,特将此类标记称为中间型标记,如TRAP标记。
2.1新型非特异标记SRAP的研究
相关序列扩增多态性(sequence-relatedamplifiedpolymorphism,SRAP由美国加州大学Li与Quiros博士于2001年提出。
引物设计是SRAP分析的核心。
SRAP标记分析共有两套引物。
在一组正向SRAP引物中使用“CCGG”序列,其目的是使之特异结合ORFs区域中的外显子;
反向引物的3'
端含有核心AATT,其目的是为了提高多态性。
研究表明外显子一般处于富含GC区域,如拟南芥2和4号染色体的全序列中,外显子CG比例分别为46.5%和44.08%,而内含子中则为32.1%和33.08%(Linetal.,1999。
由于内含子、启动子和间隔序列在不同物种甚至不同个体间变异很大,富含AT的区域序列通常见于启动子和内含子(LiandQuiros,2001,这就使得有可能扩增出基于内含子与外显子的SRAP多态性标记。
Li和Quiros(2001利用同一引物组合,从甘蓝类不同作物中(包括花椰菜、表花菜等可获得多个SRAP标记,且在不同实验中多态性条带重复性极好;
同时,在花椰菜DH植株与青花菜杂交产生的F2群体cDNA中检测到281个多态性SRAP标记,构建了由cDNA-SRAP标记组成的转录图谱。
2.2新型中间型标记TRAP的研究
靶位区域扩增多态性(targetregionamplifiedpoly-morphism,TRAP标记由美国农业部北方作物科学实验室Hu与Vick于2003年提出。
SRAP使用两个任意引物;
而TRAP是使用任意引物与长度为16~20个核甘酸的固定引物,任意引物与SRAP所用的一
样,为一段以富含AT或GC为核心、
可与内含子或外显子区配对的随机序列;
固定引物以公用数据库中的靶EST序列设计而来。
Hu与Vick(2003设计了与向日葵EST数据库中编码富含亮氨酸重复(LRR类似蛋白序列配对的固定引物,利用TRAP标记分析,对向日葵属16个野生种及2个杂交种的遗传变异性进行评估。
结果
132
表明TRAP标记可用于评估向日葵的遗传多样性分析,聚类结果与经典分类相一致;
其中一个TRAP引物结合到与抗病性有关的基因序列。
张丽等(2008利用24对TRAP引物对16个玉米自交系进行了遗传多样性分析,共扩增出475条具多态性的谱带,平均多态性信息量为0.9044,平均多态性比率为84.8%。
对16个自交系类群划分结果与系谱分析结果基本一致。
表明TRAP技术在遗传多样性分析别和重要目的农艺性状的基因定位方面存在广泛的应用前景。
3特异性分子标记的研究
3.1SSR分子标记的开发策略
传统的SSR分子标记开发需先制备基因组DNA片段,筛选较小DNA片段,连接载体并转化大肠杆菌,构建基因组文库。
用人工合成带放射性同位素或非放射性标记的SSR探针进行文库筛选。
对阳性克隆进行测序,根据SSR重复的侧翼序列信息设计引物。
这种方法工作量大,近年来有些学者相继提出一系列高效的SSR标记开发策略。
3.1.1基于RAPD富集SSR
为避免基因组文库构建和筛选阳性克隆,Cifarelli等(1995提出利用SSR与随机扩增产物杂交的开发策略,并在糖用甜菜、橄榄、向日葵上成功分离出SSR。
其主要程序是:
先进行RAPD扩增,琼脂糖凝胶电泳分离扩增条带。
再将RAPD扩增产物转到硝酸纤维膜上,并用地高辛标记的特异SSR探针与扩增产物进行杂交。
对阳性条带进行回收、克隆、测序。
序列分析表明,两端为RAPD引物,内部包含SSR序列。
3.1.2基于ISSR-PCR的SSR分离
ISSR标记是与基于RAPD的分离策略相比,ISSR-PCR基础上的分离方法同样避免了文库的构建与筛选,而且避免了SSR富集的随机性,从而大大缩短了时间,降低了研究费用。
Fisher等(1996年设计5'
-KKVRVRV(CT6-3'
为简并引物对基因组DNA进行PCR扩增。
对简并引物多基因座PCR产物克隆,随机选取8个克隆测序,结果表明,各SSR相异,且序列两侧均有SSR存在,重复数6~12不等。
该方法的优点在于不仅可方便快捷建立SSR富集文库,而且只需设计合成SSR一侧引物序列,
就可与原简并引物配合使用,省去了设计合成SSR另一侧引物的费用。
3.1.3建立序列标签文库获得SSR引物序列
Hayden和Sharp(2001通过建立序列标签文库富集SSR。
该方法结合ISSR-PCR扩增、选择性杂交、酶切、连接等技术,将从基因组中筛选捕获的多个含SSR一侧保守序列的片段连接后克隆到质粒载体中,建成序列标签库。
该序列标签库中每个克隆都含有多个SSR一侧保守序列,可用于设计SSR引物,大大提高了工作效率。
另外,还有基于引物延伸(Ostranderetal.,1992、基于选择杂交(Karagyozovetal.,1993等方法,这些方法各有优缺点,其相应技术原理可参考相应文献,这里不再一一赘述。
相比之下,基于ISSR-PCR扩增的富集方法所需设备简单,技术成熟,适合于多数实验室开展工作。
3.2利用RFLP和RAPD转化为特异性的PCR标记Causse等(1994构建了包含800个RFLP标记的
水稻遗传连锁图。
但该技术检测步骤较多,周期长,检出的多态性较少。
基于PCR技术的RAPD分子标记
多态性检出率高,操作简便、
快速,但对反应条件极为敏感,重演性相对较差(WelshandMcClelland,1991。
通过对基因组DNA克隆的双向末端测序并依据末端序列设计引物,William等(1991将RFLP标记转换为SCAR标记。
这些引物直接以基因组DNA为模板进行PCR反应扩增多态性区域。
如果扩增产物没有
长度多态性,对PCR片段进行限制性酶切,
如果其内部序列存在酶切位点的差异,则这样可以将改标记转化为CAPS标记。
RAPD标记快捷方便,不需预知序列信息,但较低的稳定性限制了其应用。
Paran和Michelmore(1993及Nair等(1995;
1996通过将与抗虫基因连锁的RAPD标记转化为SCAR标记,提高了标记的可靠性及特异性。
3.3利用AFLP标记开发特异性分子标记的策略
AFLP技术是Vos等(1995发明的一种标记,其
原理是将基因组用限制性内切酶消化后,两端连接上接头,用根据接头核苷酸序列和酶切位点特征设计的引物进行两轮PCR扩增。
它具有多态性丰富、
检测效率高、
重现性强、覆盖整个基因组及无需预知序列信息等优点。
然而,
由于AFLP标记操作繁杂且比较昂贵,
有必要将其转化为单位点、易操作的标记类型。
近年来,
关于将AFLP转化为单位点易操作标记被相继报道(Shanetal.,1999;
Meksemetal.,2001;
Brugmansetal.,2003,本文综合多篇文献及个人实
践体会筛选整合一套适宜普通实验室进行AFLP转化的技术路线。
3.3.1对共显性AFLP标记的转换
AFLP标记多数情况下表现为显性,当不同材料中选择性扩增片段有长度差异时就表现为共显性。
133
比如当检测材料包含双亲及杂种一代时,可在凝胶上分辨出共显性AFLP标记片段。
此时只需回收目标片段并以其为模板用相应的选择性扩增引物再扩增,测序,根据两端序列设计引物,即可将把共显性AFLP标记转化为特异性的共显性SCAR标记。
3.3.2对显性AFLP标记的转换
由酶切位点及选择性碱基的差异而产生的显性AFLP标记则需要以下步骤将其转化:
(1选择清晰可辨的多态性条带,回收并测序(NicodandLargiader,2003。
(2根据