分子生物学课件整理.docx
《分子生物学课件整理.docx》由会员分享,可在线阅读,更多相关《分子生物学课件整理.docx(75页珍藏版)》请在冰点文库上搜索。
分子生物学课件整理
注:
根据课件内容简单整理,为了方便大家理解,内容较多;如果仅仅为了考试,可以根据自己的需要进行内容的删减。
Lecture1.Introduction
1.WhatisMolecularBiology?
Molecularbiologyseekstoexplaintherelationshipsbetweenthestructureandfunctionofbiologicalmoleculesandhowtheserelationshipscontributetotheoperationandcontrolofbiochemicalprocesses.
Molecularbiologyisthestudyofgenesandtheiractivitiesatthemolecularlevel,includingtranscription,translation,DNAreplication,recombinationandtranslocation.
分子生物学的研究内容
Majorcontentofmolecularbiology
◆StructureandFunctionofnucleicacid
★conformationandfunctionofDNA
★conformationandfunctionofRNA
◎mRNA◎tRNA◎rRNA◎ribozyme◎antisenceRNA
◎microRNA◎RNAinterfrence
人们开发出:
RNAi、RNAa、ncRNA、SiRNA、microRNA、AntiseneRNA、SatellileRNA、TelomereRNA、lincRNA、InCRNA、PiRNA、qiRNA、endoSiRNA等等,其他还有RNA结合蛋白(RNPs)、RNA酶等成百上千种RNA相关的新成员,组成了一个庞大的RNA新世界
这些RNA不仅在基因-蛋白质的合成中发挥重要作用,它更调节和管理着—基因的转录、表达、表型等几乎所有的功能。
在细胞增殖、分化、生长、凋亡、生殖、发育、遗传、损伤、修复、炎症、感染、防治等一切生命活动中发挥着重要作用;
RNA还是生命起源的“先驱’’,近年来研究证明,RNA比DNA更古老,它是地球上最早出现的生命形式;它可以携带遗传信息,能自我复制,自我进化,自我编译,又具有催化分子功能------,以后才有了DNA和蛋白质,才有了今天的生物世界。
RNA更是人类生命健康的维护者,它不仅调节和管理着人类的一切生命活动,而且它还是防治许多重大的疾病和开发新药物的靶分子和预警分子,并可直接和间接的发挥防治疾病的作用。
◆FunctionalGenomics
◎AstheHumanGenomeProjecthasmostlydeterminedthegeneticsequence,thenextstepisfunctionalgenomics,whichwillrevealeachgene'sfunctionsandcontrols
◎HumanGenomeDiversityProject
◎EnvironmentalGenomeProject
◎Pharmacogenomics
◎ComparativeGenomics
Artificiallife
人工生命是通过人工模拟生命系统,来研究生命的领域。
人工生命的概念,包括两个方面内容
1.属于计算机科学领域的虚拟生命系统,涉及计算机软件工程与人工智能技术,以及
2.基因工程技术人工改造生物的工程生物系统,涉及合成生物学技术。
分子生物学与医学
◆人体发育调控和人体功能调控的分子生物学基础
◎发育、分化与衰老的分子生物学基础
◎细胞增殖调控的分子生物学基础
◎神经、内分泌和免疫调控的分子生物学基础
◆基因与疾病
◎疾病的分子机理
致病基因的克隆
复杂疾病的分子基础
◎基因诊断
◎基因治疗
Lecture2structureandfunctionofgene
第一节基因的概念及其发展
一基因(gene)
(一)基因的概念的产生和发展
2、Morgan基因的物质载体是染色体
3、G.Beadle&R.Tatum
基因是决定蛋白质一级结构的遗传物质单位
5、O.Avery
基因的化学本质是DNA
6、Jacob&Monod
基因是在特定的遗传调控系统的调节下和控制下表达其功能的遗传物质单位
7、现代的基因概念
基因是核酸分子中储存遗传信息的遗传单位,是指储存有功能的蛋白质多肽链或RNA序列信息所必需的全部核苷酸序列
二、基因组(genomic)
Thegenomeistheentiretyofanorganism'shereditaryinformation.ItisencodedeitherinDNAor,formanytypesofvirus,inRNA.Thegenomeincludesboththegenesandthenon-codingsequencesoftheDNA
细胞或生物体中,一套完整单倍体的遗传物质的总和。
人类基因组包含24条染色体以及线粒体上的全部的遗传物质。
第二节真核生物基因组
一、基因分类
1、结构基因(strutualgene)可被转录形成mRNA并进而翻译位多肽链,构成各种结构蛋白的基因
2、调节基因(regulatorygene)可调节、控制结构基因表达的基因。
其突变可能会影响一个或多个结构基因的功能,导致一个(或多个)蛋白质的改变。
3、rRNA基因和tRNA基因
二、基因的结构
enhancerpromoterexon5UTR,
3UTRintron
(一)编码区
1、外显子(exon)2、内含子(intron)
★GT—AG规则:
内含子多是以GT开始,并以AG结尾
★一个基因的内含子可以是另一个基因的外显子。
★外显子的数量是描述基因结构特征的重要指标。
三、调控元件(actingelements)
(二)前导区:
位于编码区的上游,相当于mRNA5端的非编码区
(三)调节区:
包括启动子、增强子等基因编码区的两侧,也称侧翼序列
◎顺式调控元件(cis-actingelements):
与结构基因表达调控相关。
能够被基因调控蛋白特异性识别和结合的DNA序列。
◎反式调控元件(trans-actingelements):
一些可以通过结合顺式元件而调节基因转录活性的蛋白因子。
(一)启动子(promoter)
启动子是DNA分子可以与RNA聚合酶特异结合的部位,也就是使转录开始的部位。
在基因表达的调控中,转录的起始是个关键。
常常某个基因是否应当表达决定于在特定的启动子起始过程。
2启动子的类型
(1)一类是RNA聚合酶可以直接识别的启动子这类启动子应当总是能被转录。
但实际上也不都如此,外来蛋白质可对其有影响,即该蛋白质可直接阻断启动子,也可间接作用于邻近的DNA结构,使聚合酶不能和启动子结合
(2)另一类启动子在和聚合酶结合时需要有蛋白质辅助因子的存在。
这种蛋白质因子能够识别与该启动子顺序相邻或甚至重叠的DNA顺序。
3启动子的共同顺序
⑴真核生物基因启动子位于RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。
这两个序列的共同顺序如下,
-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。
-10序列又称为Pribnow盒(原核生物)。
是RNA聚合酶所结合和作用必需的顺序
⑵真核生物基因启动子
▲TATAbox(Goldberg-Hognessbox):
位于-35bp处,序列为TATA(A/T)A(T/A)是RNA聚合酶Ⅱ的结合部位
▲CAAT盒:
在转录起始位点上游70-80bp处
保守的共同顺序:
GCCTCAATCT。
RNA聚合酶Ⅱ可以识别这一顺序。
⑶启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序
[1]RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;
[2]离开共同顺序较远的启动子的活性亦较弱;
[3]最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。
-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。
因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。
可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。
"
(三)增强子(enhancer)
★位于结构基因附近,能够增强该基因转录活性的一段DNA顺序称为增强子(enhancer)。
★增强子是另一类顺式作用的DNA片段,可使基因转录的速率大大提高。
增强子的类型
①组织和细胞专一性增强子
许多增强子的增强效应有很高的组织细胞专一性,只有在特定的转录因子(蛋白质)参与下,才能发挥其功能。
②诱导性增强子
这种增强子的活性通常要有特定的启动子参与。
例如,金属硫蛋白基因可以在多种组织细胞中转录,又可受类固醇激素、锌、镉和生长因子等的诱导而提高转录水平。
增强子的特点
①增强子可提高同一条DNA链上基因转录效率,可以远距离作用,通常距离l~4kb,个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。
②增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。
而将启动子倒置就不能起作用,可见增强子与启动子是很不相同的。
③增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现其活性。
但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。
④增强子必须与特定的蛋白质因子结合后才能发挥增强转录的作用。
增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有的特异性蛋白质因子所决定的。
例如,人类胰岛素基因5’端上游约250个核苷酸处有一组织特异性增强子。
在胰岛素p细胞中有一种特异性蛋白因子,可以作用于这个区域,以增强胰岛素基因的转录。
在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。
⑤大多为重复序列,一般长约50bp,适合与某些蛋白因子结合。
其内部常含有一个核心序列,即(G)TGGA/TA/TA/T(G),是产生增强效应时所必需的。
⑥许多增强子还受外部信号的调控,如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。
增强子的作用机理
①增强子中有Z-DNA结构,这种结构的双链间距离大于B-DNA,与蛋白质的亲和力更高一些,有利于转录。
②增强子中有DNA水解酶容易切断的部位,可与一些转录因子蛋白形成复合物,促进转录。
③增强子可与核基质结合形成结构体,促进转录。
3.沉默子(Silencer)
SilencersarecontrolregionsofDNAthat,likeenhancers,maybelocatedthousandsofbasepairsawayfromthegenetheycontrol.However,whentranscriptionfactorsbindtothem,expressionofthegenetheycontrolisrepressed.
沉默子的特点
(1)可以在远距离作用于启动子
(2)对基因的阻遏作用没有方向的限制,即无论其位于启动子的上游或下游均可阻遏启动子的表达
沉默子的作用机理
沉默子介导产生的沉默是一种状态的变化,在此过程中,产生类似于异染色质的结构阻止转录因子与DNA的相互作用,使转录被抑制,沉默子作为异染色质形成中的失活中心参与沉默状态的建立和扩散
沉默子含阻遏蛋白结合序列,阻遏蛋白与其结合后阻遏基因的转录。
直接阻遏(direct repression)沉默子结合蛋白与转录复合物中的成员结合后将其固定,使基础转录复合物无法形成而丧失活性
竞争(competition)在一些基因中沉默子与增强子等正调控元件相邻或相重叠,阻遏蛋白结合后阻止激活蛋白与邻近正调控元件的结合从而阻遏转录
淬灭沉默子与增强子相邻,阻遏蛋白与沉默子结合后,虽不影响激活蛋白与DNA的结合能力,却通过蛋白之间的相互作用阻止激活蛋白与转录复合物的正确接触来抑制其活性
某些沉默子中含有骨架结合位点保守序列
沉默子与蛋白结合,通过蛋白之间的相互作用形成DNA环后与启动子作用,破坏起始复合物而抑制转录;
或者产生的DNA环发生了组蛋白的修饰和拓扑结构的变化,这种变化使关键的转录因子不能正确结合从而阻止转录
也可能沉默子和核基质相互作用将转录单元固定于缺乏转录因子的亚显微结构
4.绝缘子(insulator)
绝缘子(insulator)长约几百个核苷酸对,是通常位于启动子同正调控元件(增强子)或负调控因子(为异染色质)之间的一种调控序列。
绝缘子本身对基因的表达既没有正效应,也没有负效应,其作用只是不让其他调控元件对基因的活化效应或失活效应发生作用。
绝缘子的功能
①有序地装置庞大的染色体DNA以及确保其中上万种基因每一种都能在时空上正确无误地表达。
绝缘子在这里起着关键的阻断作用,保护启动子的功能不受其它异常增强子或其它激发信号的有害影响
②防止基因免受邻近沉默信号的作用。
这类沉默信号系来自细胞核的内环境中遍布的大量致密染色质的“扩张”或“溢出”。
绝缘子的这种功能可以维持染色质区域的分界以及保护基因座位的独立性。
绝缘子的作用原理
①结构域边界模型(Domainboundarymodel,)
绝缘子能使它所限定的染色质区域发生折叠成环,促使该区域内各种调节元件彼此相互作用,同时也阻止了不同区域调节元件之间互相影响。
染色质形成环状结构域能对抗附近致密染色质结构的扩展。
这样一来,绝缘子能防止位置效应也能得到合理的解释。
②“跟踪”模型(“Tracking”model):
结合在增强子元件上的转录因子沿DNA链向它的目标启动子追逐。
此时绝缘子的特异结合蛋白在中途阻挡转录因子,使其不能抵达启动子区域。
③转录诱捕模型(Transcriptiondecoymodel)
在绝缘子与其特异结合蛋白结合所形成的复合物可成为捕捉增强子的笼子,将增强子复合物吸引到其中而使之失去功能。
四、基因家族(genefamily)
(一)基因家族的概念
1、基因家族:
核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。
由同一祖先基因进化而来。
2、假基因(pseudogene)
在多基因家族中,某些成员并不能表达出有功能的产物,这些基因称为假基因。
假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。
与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。
人们推测,假基因的来源之一,可能是基因经过转录后生成的RNA前体通过剪接失去内含子形成mRNA,如果mRNA经反转录产cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。
(二)、基因家族大致可分为两类
1、一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;
2、另一类是一个基因家族的不同成员成簇地分布在不同的染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族
五、重复序列:
高度重复序列中度重复顺序单拷贝顺序
(一)高度重复序列
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种。
1、倒位(反向)重复序列(invertedrepeats)
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
约占人基因组的5%。
2、卫星DNA
卫星DNA(satelliteDNA)是另一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成串排列。
由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。
在人细胞组中卫星DNA约占5-6%。
§大卫星DNA(macrosatelliteDNA)
§小卫星DNA
(minisatelliteDNA)
§微卫星DNA(microsatelliteDNA)
3、较复杂的重复单位组成的重复顺序
这种重复顺序为灵长类所独有。
用限制性内切酶HindⅢ消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。
有人把这类称为α卫星DNA。
而人的α卫星DNA更为复杂,含有多顺序家族。
4、高度重复顺序的功能
⑴参与复制水平的调节反向序列常存在于DNA复制起点区的附近。
另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。
⑵参与基因表达调控DNA的重复顺序可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用
⑶参与转位作用几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。
由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。
⑷与进化有关不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。
如人的α卫星DNA长度仅差1个碱基(前者为171bp,后者为172bp),而且碱基序列有65%是相同的,这表明它们来自共同的祖先。
在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。
⑸同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹。
(二)中度重复顺序
中度重复序列大致指在真核基因组中重复数十至数万(<105)次的重复顺序。
其复性速度快于单拷贝顺序,但慢于高度重复顺序。
少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。
依据重复顺序的长度,中度重复顺序可分为两种类型。
(1)短分散片段
(shortinterspersedrepeatedsegments,SINES)
这类重复顺序的平均长度约为300bp(〈500bp),它们与平均长度约为1000bp的单拷贝顺序间隔排列。
拷贝数可达10万左右。
如Alu家族,Hinf家族等属于这种类型的中度重复序列
(2)长分散片段
(Longinterspersedrepeatedsegments,LINES)
这类重复顺序的长度大于1000bp,平均长度为3500-5000bp,它们与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列。
也有的实验显示人基因组中所有LINES之间的平均距离为2.2kb,拷贝数一般在1万左右,如KpnⅠ家族等。
中度重复顺序在基因组中所占比例在不同种属之间差异很大,一般约占10-40%,在人约为12%。
这些顺序大多不编码蛋白质。
这些非编码的中度重复顺序的功能可能类似于高度重复顺序。
在结构基因之间,基因簇中,以及内含子内都可以见到这些短的和长的中度重复顺序。
如HLA基因,rRNA基因,tRNA基因,组蛋白基因,免疫球蛋白基因等。
中度重复顺序一般具有种属特异性;在适当的情况下,可以应用它们作为探针区分不同种哺乳动物细胞的DNA。
下面介绍几种典型的中度重复顺序。
Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%。
Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)从而将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)。
Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA,内含子中都发现有Alu序列,平均每5kbDNA就有一个Alu顺序。
KpnⅠ家族是中度重复顺序中仅次于Alu家族的第二大家族。
用限制性内切酶KpnⅠ消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2,1.5,1.8和1.9kb,这就是所谓的KpnⅠ家族。
KpnⅠ家族成员顺序比Alu家族更长(如人KpnⅠ顺序长6.4kb),而且更加不均一,呈散在分布,属于中度重复顺序的长分散片段型。
尽管不同长度类型的KpnⅠ家族(称为亚类,subfamily)之间同源性比较小,不能互相杂交,但它们的3'端有广泛的同源性。
KpnⅠ家族的拷贝数约为3000 ̄4800个,占人体基因组的1%,与散在分布的Alu家族相似,KpnⅠ家族中至少有一部份也是通过KpnⅠ顺序的RNA转录产物的cDNA拷贝的重新插入到人基因组DNA中而产生的。
Hinf家族:
这一家族以319bp长度的串联重复存在于人体基因组中。
用限制性内切酶HinfⅠ消化人体DNA,可以分离到这一片段。
Hinf家族在单位基因组内约有50100个拷贝,分散在不同的区域。
319bp单位可以再分成两个亚单位,分别为172bp和147bp,它们之间有70%的同源性。
rRNA基因:
在原核生物如大肠杆菌基因组中,rRNA基因一共是七套;在真核生物中rRNA基因的重复次数更多。
在真核生物基因组中18S和28S,rRNA基因是在同一转录单位中,低等的真核生物如酵母中,5SrRNA也和18S,28SrRNA在同一转录单位中;
而在高等生物中,5SrRNA是单独转录的,而且其在基因组中的重复次数高于18S和28S基因。
和一般的中度重复顺序不一样,各重复单位中的rRNA基因都是相同的。
rRNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为rDNA,如染色体的核仁组织区(nucleolusorganizerregion)即为rDNA区。
(三)单拷贝顺序
单拷贝顺序在单倍体基因组中只出现一次或数次,因而复性速度很慢。
单拷贝顺序在基因组中占50-80%,如人基因组中,大约有60-65%的顺序属于这一类。
单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质。
六、真核生物基因组的特点
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制