核酸分子杂交技术概述Word格式.docx
《核酸分子杂交技术概述Word格式.docx》由会员分享,可在线阅读,更多相关《核酸分子杂交技术概述Word格式.docx(43页珍藏版)》请在冰点文库上搜索。
DNA
嘌呤碱
腺嘌呤鸟嘌呤
嘧啶碱
胞嘧啶尿嘧啶
胞嘧啶胸腺嘧啶(或5-甲基胞嘧啶)
戊糖
核糖
脱氧核糖
磷酸
二、核酸的一级结构
核酸又称多核苷酸,组成DNA的脱氧核糖核苷酸主要为四种,即dAMP、dGMP、dCMP及dTMP;
组成RNA的核糖核苷酸主要有AMP、GMP、CMP及UMP四种。
对两种核酸的组成可简写如下:
DNA=(碱基-脱氧核糖-磷酸)n;
RNA=(碱基-核糖-磷酸)n
核酸中核苷酸的连接方式为:
一个核苷核C-3’上羟基与下一个核苷核酸C-5’连接在磷酸羟基脱水缩合成酯键,称酯键称3’5’磷酸二酯键,若干个核苷酸间依3’5’磷酸二酯键连接成长链的大分子即为核酸。
此长链称多核苷酸链,在链的一核苷酸,其C-5’连接的磷酸只一个酯键,称此核苷酸为链的5’磷酸未端或5’。
链的另一端核苷酸上C-3’上羟基是自由的,对此核苷酸称为3’羟基末端或3’端,链内的核苷酸在C-5’上磷酸已形成二酯键,C-3’上羟基也已参与二酯键的形成,故称核苷酸残基。
核酸的一级结构乃指其核苷酸链中核苷酸的排列顺序,由于核酸中核苷酸彼此之间的差别乃在于碱基部分,故核酸的一级结构即指核酸分子中碱基的排列顺序。
对核酸一级结构的描述为:
将5’磷酸末端书于左侧,中间部分为核苷酸残基,3’羟基末端书于右侧。
通常用竖线表示核糖,碱基标于竖线上端,竖线间有含P的斜线,代表3’,5’磷酸二酯键。
此表示法及简化式如下:
三、核酸的高级结构
核酸的多核苷酸链在次级键的基础上,还可形成更为复杂的二级及三级的高级结构。
(一)DNA
1.二级结构1953年Watson及Crick在化学分析及X光衍射法观察DNA结构的基础上提出了著名的DNA双螺旋结构模型(doublehelixmodel)此结构是在核酸一级结构基础上形成的更为复杂的高级结构,即DNA的二级结构,结构如图18-1。
图18-1 DNA的双螺旋结构
P:
磷酸基;
S:
脱氧核糖;
G:
鸟嘌呤;
A:
腺嘌呤;
T:
胸腺嘧啶C:
胞嘧啶
DNA的二级结构即双螺旋结构,其内容可归纳为:
(1)DNA分子为二条多核苷酸链以一共同轴为中心,盘绕成右手双螺旋结构。
螺旋直径2nm。
螺旋盘绕形成链间的两种沟,即宽的大沟与狭窄的小沟。
(2)二条多核苷酸链的走向相反,通常取左侧链从上到下为5’→3’端,右则链从下向上为5’→3’端,这样二条链构成反平行排列的双螺旋。
(3)二条多核苷酸链借氢键而连系在一起。
氢键乃一链碱基上-NH2的氢与另一链上碱基的氧或氮形成。
碱基有二个氢键,G与C之间有三个氢键(图18-3)。
这种相配关系称为碱基互补或碱基配对。
配对的碱基处于同一平面,此平面与双螺旋的中心轴垂直,由于二条链中碱基互补,所以二链彼此又称为互补链。
(4)碱基对之间氢键的能量为3~7kcal/mol,由于氢键多,所以可维系DNA双链结构。
另外碱基对彼此间距离为0.34nm,每一螺旋含10个碱基对,故螺距为3.4nm,相邻碱基对间彼此尚有范德瓦士(vanderWaals)力作用(此力量为1~2kcal/mol,作用范围为0.5nm),能量虽弱但由于碱基对多,合力也就大。
可见碱基对的氢键及碱基对之间的范德瓦士力是稳定DNA成双螺旋结构的主要能量。
上述DNA的双螺旋结构是溶液及活体中常见的形式,通称B型。
当B型所处条件的湿度低于75%时,可转变为A型。
A型的碱基对不垂直于双螺旋的轴、倾斜约20度,螺距降为2.8nm,每一螺旋含11个碱基对。
B型与A型的水合程度不同,它们是DNA分子在天然条件下的两种基本形式。
除A、B型外尚发出有C型双螺旋,似B型,螺距3.3nm,第一螺旋含9个碱基对。
DNA双螺旋结构阐明的量重要意义在于第一次提出了遗传信息是以DNA分子中核苷酸的排列顺序为储存方式,从而说明了天然遗传信息的复制过程。
2.三级结构已发现线粒体、叶绿体、细菌、质粒及一些病毒的DNA双螺旋分子尚可形成封闭环状,天然状态的环状DNA分子多扭曲成麻花状的超螺旋结构(superhelix),这些比螺旋更为复杂的结构即DNA分子的三级结构。
真核生理细胞核中的DNA具有一种超螺旋结构,即DNA双螺旋盘绕在组蛋白上形成核小体(nucleosome)。
核小体是染色质(chromatin)的核心小粒,由有140个碱基对的双螺旋DNA缠绕于由组蛋白(H2A、H2B、H3及H4各二分子)组成的八聚体外面,这一DNA股由此形成直径为9nm的超螺旋1.75圈。
此核小体又经60个碱基对的DNA双螺旋及组蛋白H1形成细丝(间隔区)与下一个核小体相连接。
核小体的DNA双螺旋为200个碱基对,长度应为0.34nm×
200=68nm,但实际长度只10nm,说明DNA双螺旋链进一步螺旋化盘绕在组蛋白八聚体上,其长度压缩了7/8。
每6个核小体又绕成一圈形成螺线管,外径为30nm,螺距为10nm。
这样DNA分子长度被压缩了6/7。
120个螺线管又盘绕成直径为400nm,高为30nm的超螺线管,DNA分子长度又被压缩了40/41,此超螺线管即染色体的单位纤维(unitfiber),长20~60nm。
从单位纤维形成染色单体(chromatid),实际长度为2~10nm,DNA分子长度又被压缩了5/6~6/7。
这样从许多核小体组成的串珠样纤维经多层次螺旋化结构到形成染色单体,DNA分子的长度已被压缩至近1/10000。
(二)RNA
RNA分子也是由核苷酸依3’,5’磷酸二酯键形成的多核苷酸链。
RNA总是以单链的形式存在,也有5’磷末端及3’羟基末端。
RNA单链的局部折叠成的某一片段的A及G分别与另一片段的U及C配对常形成发夹结构(hairpinstructure)。
在此结构内的碱基无需全部配对,而配对部位形成小的双螺旋区域,不能配对的碱基则连成小环从螺旋区中被圈出来。
这种RNA单链局部小双螺旋结构即是RNA的二级结构。
四、基本组织
由于DNA分子中核苷酸序列分析以及一级结构与功能相关的研究,使得人们有可能进一步了解DNA一级结构与基因组织的关系。
已经证实,自然界极大多数生物体遗传信息贮存在DNA的核苷酸排列顺序中,因此,基因是DNA的一个片段,只有少数病毒的遗传信息贮存在RNA分子中。
DNA分子中不同区域有不同功能,有些区域可编码蛋白质(最终产物是蛋白质),有些区域可编码RNA(最终产物是tRNA和rRNA),有些序列则与调控有关。
那么一个DNA分子能携带多少基因呢?
如果以平均1000个碱基对可编码一个3kD的蛋白质计算,猴病毒(SV40)DNA分子量为3.0×
105,有5000碱基对可编码5种蛋白质。
人染色体DNA有2.3×
109碱基对,可编码200万以上的基因,但实际上,最多可编码基因数为2~3万。
这是由于真核细胞DNA分子除编码蛋白质和RNA等结构基因外,有相当部分DNA顺序属于非编码区,而原核细胞DNA由于分子较小,必需充分利用有限的核苷酸序列。
各种生物体内DNA分子的大小见表18-2。
表18-2各种生物体内DNA分子的大小
来源
分子量
碱基对数目
长度
噬菌体фX174
0.6μm
腺病毒(SV40)
1.6×
106
4500
1.5μm
鼠线粒体
3.0×
14000
4.9μm
噬菌体λ
9.5×
50000
17μm
噬菌体T2或T4
3.3×
107
200000
67μm
大肠杆菌染色体
1.3×
108
4500000
人染色体
109
125000000
4.1μm
1.真核生物的基因组织根据某一段核苷酸顺序在整个DNA分子中出现的频率不同可分为以下几种:
(1)单拷贝顺序(singlecopysequence):
在整个DNA分子中只出现一次或少数几次,主要是编码蛋白质的结构基因。
除组蛋白、角蛋白和肌动蛋白以外,几乎所有的蛋白质基因都是单拷贝顺序,平均为1000碱基对。
单拷贝基因在整个基因组织中所占比例最高。
在人的细胞中约占DNA含量的一半。
(2)中等重复顺序(moderatelyrepetitivesequences):
有些基因如核蛋白体RNA基因、tRNA基因、组蛋白基因等在DNA分子中可重复出现几十到几千次,约占人细胞DNA含量的30~40%。
以rRNA为例,在大肠杆菌中重复频率为7而果蝇中可重复千次。
可见真核细胞中重复顺序比原核细胞高得多。
(3)高重复顺序(highlyrepetitivesequences):
可重复几百万次。
往往是简单的重复顺序,如蟹的T-A-T-A-T-A-T。
也有的较长如非洲绿猴DNA是以172个碱基对的顺序为基础重复几万次。
高重复顺序一般位于异染色质上,多数不编码蛋白质或RNA,其功能还不太清楚,主要是起间隔作用,可能与调控有关。
在重复顺序中还有一种反转重复顺序(invertedrepetitivesequences)。
其特点是一段碱基呈现回文结构,即一条单链回折即可形成互补的双链,故称为回文结构(palindromicstructure)或发夹结构(hairpinstructure)。
这种结构对基因的复制与转录可能具有调节 控制功能。
真核细胞中单拷贝顺序和重复顺序常常是中间隔排列的。
不仅如此,在一个基因内部往往被一个或几个额外的顺序分割成若干片段,这种插入到基因内部的顺序称为插入顺序或内含子(intron)。
内含子是不编码的顺序,而编码的碱基顺序则称为外显子(exon)。
插入顺序是真核细胞DNA最主要的特征。
真核生物由于存在着较多的重复顺序、特殊的插入顺序以及控制区和其它多余顺序,使得DNA总长度往往大于编码的结构基因,因此,实际基因数往往小于DNA分子。
2.原核生物的基因组织原核生物DNA分子较小,基因组织也较简单,一般具有以下特点:
(1)DNA分子绝大部分用于编码蛋白质,不编码部分(又称间隔区)通常包含控制基因表达的顺序。
例如,噬菌体фX174中只有5%是非编码区。
(2)功能相关的基因常常串联在一起,并转录在同一个mRNA分子中,称为多顺序反子。
这种现象在真核生物中是很少见的。
(3)基因重叠:
例如фX174的E基因全部包括在D基因内,B基因则包括在查基因内。
这种现象主要发现在病理DNA分子中,可能是由于DNA分子太小又要装入相当量的基因的缘故。
第二节 DNA的变性与复性
一、DNA变性
DNA变性是指双螺旋之间氢键断裂,双螺旋解开,形成单链无规则线团,因而发生性质改变(如粘度下降,沉降速度增加,浮力上升,紫外吸收增加等),称为DNA变性。
加热、改变DNA溶液的pH、或受有机溶剂(如乙醇、尿素、甲酰胺及丙酰胺等)等理化因素的影响,均可使DNA变性。
通常,可利用DNA变性后波长260nm处紫外吸收的变化追踪变性过程。
因为DNA在260nm处有最大吸收值这一特征是由于含有碱基组成的缘故,在DNA双螺旋结构模型中碱基藏于内侧,变性时由于双螺旋解开,于是碱基外露,260nm紫外吸收值因而增加,这一现象称为增色效应(hyperchromiceffect)。
见图18-2。
图18-2
DNA的增色反应
如果升高温度使DNA变性,以温度对紫外吸收作图,可得到一条曲线,称为溶解曲线(见图18-3),由图可见当温度升高到一定范围时,DNA溶液在260nm处的吸光度突然明显上升至最高值,随后即使温度继续升高,其吸光度也无明显变化。
由此说明DNA变性是在一个很窄的温度范围内发生,增色效应是爆发式的。
从而也说明当达到一定温度时,DNA双螺旋几乎是同时解开的。
通常人们把50%DNA分子发生变性的温度称为变性温度(即熔解曲线中点对应的温度),由于这一现象和结晶的融解相类似,故又称融点或融解温度(meltingtemperature,Tm)。
因此Tm是指消光值上升到最大消光值一半时的温度。
图18-3
DNA的Tm值
综上所述,Tm值和增色效应是目前描述DNA特性所常用的两个量。
假定一个DNA大分子最初全部是双螺旋结构,在热变性后消光系数上升30%以上;
如果DNA原先局部就处于单链状态(例如在分子末端),则变性后上升较少。
增色效应的大小是DNA性质的一个简单指标,与分子量无关。
Tm不是一个固定的数值,它与很多因素有关:
pH、离子强度和DNA的碱基比例。
随着溶剂内离子强度上升,Tm值也随着增大。
在某一离子强度(~10-3M)以下,无需加热就使溶于其中的DNA出现不可逆变性。
与A-T碱基配对比较,DNA双螺旋内的G-C配对更为牢固。
在相同条件下,DNA内G-C配对含量高,其Tm值也高。
假定在一个双链DNA分子内某些片段含有较多G-C碱基对,根据它们局部Tm值差,用电子显微镜就可以观察和测量到这些片段,如在DNA某一片段内含有较多的A-T碱基对,在某一个温度时就可能出现双链解离的现象。
但在同一温度下,含G-C对较多部分仍然保持双链结构。
这是一种非常有用的技术。
DNA的Tm值与以下因素有关:
(1)DNA的均一性:
均一DNA如病毒DNA,解链发生在很窄的范围内,而不均一的DNA如动物细胞NDA其Tm值的范围则较宽。
(2)DNA分子中(G+C)的含量:
一定条件下DNA的Tm值,由G+C含量所决定,因为G+C之间有3个氢链,因此G+C含量较高的DNA,Tm值较高,二者的关系可用以下经验式表示:
%(G+C)=(Tm-63.0)×
2.44
实验表明DNA分子中(G+C)克分子含量百分比的大小与Tm值的高低呈直线关系,见图18-4。
图18-4
DNA和Tm值与G-C含量的关系
(3)溶剂的性质:
Tm不仅与DNA本身性质有关,而且与溶液的条件有关,通常溶液的离子强度较低时,Tm值较低,融点范围也较宽,离子强度增高时,Tm值长高,融点范围也变窄。
因此,DNA制剂不应保存在离子强度过低的溶液中,一般保存在1mol/lNaCl溶液中较稳定。
二、复性
变性DNA只要消除变性条件,二条互补链还可以重新结合,恢复原来的双螺旋结构,这一过程称为复性(renaturation)。
通常DNA热变性后,将温度缓慢冷却,并维持在比Tm低25~30℃左右时,变性后的单链DNA即可恢复双螺旋结构,因此,这一过程又叫做退火。
复性后的DNA,理化性质都能得到恢复。
倘若DNA热变后快速冷却,则不能复性(图18-5)。
图18-5 热 变性过程和两种冷却过程示意图
影响复性速度的因素很多,同样条件下,DNA顺序简单的分子复性很快,如polyd[T]和polyd[A]由于彼此互补识别很快,故能迅速复性。
但顺序较复杂的DNA分子复性则较慢。
因此通过变性速率的研究,可以了解DNA顺序的复杂性。
DNA片段的大小也影响变性的速率,因为DNA片段愈大,扩散速度愈低,使DNA片段线状单链互相发现互补的机会减少。
因此,在复性实验中,有时将DNA切成小片段,再进行复性。
同样条件下,同一种DNA浓度愈高,复性速度也愈快。
溶液的离子强度对复性速度也有影响,通常盐浓度较高时,复性速度较快。
Doty研究小组是最早对DNA变性过程进行深入研究的。
它们所获得的结果表明,在达到Tm值时,两条DNA单链分离开。
如果在加热之后慢慢地冷却,则出现部分复性,即DNA的一部分回复到双螺旋结构。
复性的程度取决于DNA浓度及信息含量的多少。
病毒DNA(信息含量少)比哺乳动物DNA容易复性,而DNA浓度较高时,有利于复性,快速冷却使DNA仍然处于变性状态,这时自由单链成链线团结构。
对这种情况,人们称之为螺旋-线团转化过程(helix-coil-transition)。
快速冷却时消光系数固然有所下降,但比天然DNA的数值始终要大。
细胞核DNA复性的动力学研究指出,DNA内很少片段有重复的或很相似的碱基顺序(所谓重复DNA)。
DNA复性的程度和过程与其信息含量的多少等有关;
因而病毒DNA比细菌DNA复性得快。
Britten发现一种测定和观察复性过程的方法。
X轴表示变性DNA原始浓度(Co)和保温时间的乘积,纵轴表示DNA复性部分(重新作为双螺旋结构出现)。
DNA比例可以用羟基磷灰石柱的办法加以确定,因为这种柱能够使单链和双链DNA分离开来。
DNA复性曲线呈S形,随着信息含量增加,此形状相同曲线往往较高Co.t值处移动。
奇怪的是,从细胞核来的DNA在复性时显示出完全不同的情形:
这些DNA中的一部分异常快地复性,而另一些DNA只有在极高的Co.t值时才出现预期的复性。
对快速复性可以作这样的解释,即在某一DNA之内同时有几个相同或很类似的顺序存在,因而找重复顺序比找DNA内唯一顺序要快得多。
后者含有特殊的遗传信息,常被称为独特DNA。
与之相反是重复DNA片段。
真核DNA自发复性的一种特殊途径是通过发夹结构。
对单链而言,要生成这种发夹结构,要求一种特定的碱基顺序,这种顺序称作回文(正读反读都相同)结构。
为了构成回文结构,DNA片段的碱基顺序必须在互补链内找到相反的顺序;
在具有相反碱基顺序的两个DNA片段之间,显然常常出现短的中间片段由于存在这样的核苷酸顺序,在复性时就能形成发夹结构。
如果存在很多重复回文结构,在部分复性时就能通过形成DNA侧链而出现十字结构。
DNA回文结构使DNA片段出现回旋对称性。
这种结构常常出现在DNA和蛋白质之间相互作用的地方,特别是后者起控制作用时。
[NextPage]
第三节 分子杂交
一、概述
前面已经介绍了核酸分子单链之间有互补的碱基顺序,通过碱基对之间非共价键(主要是氢键)的形成即出现稳定的双链区,这是核酸分子杂交的基础。
杂交分子的形成并不要求两条单链的碱基顺序完全互补,所以不同来源的核酸单链只要彼此之间有一定程度的互补顺序(即某种程度的同源性)就可以形成杂交双链。
分子杂交可在DNA与DNA、RNA与RNA或RNA与DNA的二条单链之间进行。
由于DNA一般都以双链形式存在,因此在进行分子杂交时,应先将双链DNA分子解聚成为单链,这一过程称为变性,一般通过加热或提高pH值来实现。
使单链聚合双链的过程称为退火或复性。
用分子杂交进行定性或定量分析的最有效方法是将一种核酸单链用同位素或非同位素标记成为探针,再与另一种核酸单链进行分子杂交。
核酸杂交技术基本上是Hall等1961年的工作开始的,探针与靶序列在溶液中杂交,通过平衡密度梯度离心分离杂交体。
该法很慢、费力且不精确,但它开拓了核酸杂交技术的研究。
Bolton等1962年设计了第一种简单的固相杂交方法,称为DNA-琼脂技术。
变性DNA固定在琼脂中,DNA不能复性,但能与其它互补核酸序列杂交。
典型的反应是用放射性标记的短DAN或RNA分子与胶中DNA杂交过夜,然后将胶置于柱中进行漂洗,去除游离探针,在高温、低盐条件下将结合的探针洗脱,洗脱液的放射性与结合的探针量呈正比。
该法尤其适用于过量探针的饱和杂交实验。
60年代末,Britten等设计了另一种分析细胞基因组的方法。
该法是研究液相中DNA的复性以比较不同来源核酸的复杂度,典型的方法是:
从不同生物体(细菌、酵母、鱼和哺乳动物等)内分离DNA,用水压器剪切成长约450核苷酸(nt)的片段。
剪切的DNA液(含0.12mol/L磷酸盐缓冲液或0.18mol/lNa+),经煮沸使dsDNA热变性成ssDNA。
然后冷至约60℃,在此温度孵育过程中,测定溶液一定时间内的UV260nm的吸光度(减色效应)来监测互补链的复性程度。
通常该实验可比较不同来源生物DNA的复性速率,并可建立序列复杂度与动力学复杂度间的关系。
60年代中期Nygaard等的研究为应用标记DNA或RNA探针检测固定在硝酸纤维素(NC)膜上的DNA序列奠定了基础。
如Brown等应用这一技术评估了爪蟾rRNA基因的拷贝数。
RNA在代谢过程中被3H尿嘧啶标记,并在过量的情况下与膜上固定的基因组DNA杂交,继而用RNase处理,消化非特异性结合的RNA。
漂洗后计数以测定杂交探针的量。
通过计算与已知量DNA杂交的RNA量即可评估rRNA基因数。
由于当时缺乏特异探针,这种方法不能用于研究其它特异基因的表达,这些早期过量探针膜杂交试验实际上是现代膜杂交实验的基础。
进入70年代早期,许多重要的发展促进了核酸杂交技术的进展。
例如,对特异基因转录产物的分析和对动力学杂交实验又有兴趣。
固相化的PolyU–Sepharose和寡(dT)-纤维素使人们能从总RNA中分离PolyA+RNA。
用mRNA的经纯化技术可从网织红细胞总RNA中制备α-和β-珠蛋白mRNA混合物。
这些珠蛋白mRNA首次被用于合成特异的探针以分析珠蛋白基因的表达。
由于制备cDNA探针很繁琐,所获得cDNA的长度和纯度也不稳定。
所以寻求新的探针来源是使分子杂交技术进一步推广的基础。
70年代末期到80年代早期,分子生物学技术有了突破性进展,限制性内切酶的发展和应用使分子克隆成为可能。
各种载体系统的诞生,尤其是质粒和噬菌体DAN载体的构建,使特异性DNA探针的来源变得十分丰富。
人们可以从基因组DNA文库和cDNA文库中获得特定基因克隆,只需培养细菌,便可提取大量的探针DNA。
迄今为止,已克隆和