第02章 基因组的结构.docx

上传人:b****2 文档编号:894797 上传时间:2023-04-30 格式:DOCX 页数:9 大小:24.56KB
下载 相关 举报
第02章 基因组的结构.docx_第1页
第1页 / 共9页
第02章 基因组的结构.docx_第2页
第2页 / 共9页
第02章 基因组的结构.docx_第3页
第3页 / 共9页
第02章 基因组的结构.docx_第4页
第4页 / 共9页
第02章 基因组的结构.docx_第5页
第5页 / 共9页
第02章 基因组的结构.docx_第6页
第6页 / 共9页
第02章 基因组的结构.docx_第7页
第7页 / 共9页
第02章 基因组的结构.docx_第8页
第8页 / 共9页
第02章 基因组的结构.docx_第9页
第9页 / 共9页
亲,该文档总共9页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

第02章 基因组的结构.docx

《第02章 基因组的结构.docx》由会员分享,可在线阅读,更多相关《第02章 基因组的结构.docx(9页珍藏版)》请在冰点文库上搜索。

第02章 基因组的结构.docx

第02章基因组的结构

第02章基因组的结构

      第二章基因的结构    第二章基因组的结构  第一节基因的基本结构和命名  一、基因的功能类别  按有无蛋白产物可将基因分为两类:

  ?

翻译基因:

经转录并翻译成多肽链的基因。

  ?

非翻译基因:

只转录而不翻译的基因,如rRNA,tRNA基因。

  二、基因的基本结构  基因的基本结构包括DNA上与基因的复制、转录、翻译功能对应的结构。

如复制起始区、复制终点、转录启动子、终止子、翻译起始密码、终止密码、增强子、沉默子等。

  三、基因的命名  1906年等提出的基因命名规则      1.每个基因用斜体小写的三个字母表示,这三个字母取自表示该基因特性的一个或一组英文单词的前三个字母。

  例如:

与核糖体大亚基有关的基因表示为rpl;与核糖体装配、成熟有关的基因表示为为rim  2.表型相同基因的不同突变型,在三个字母后用一个不同的大写英文字母表示。

  例如:

trp表示色氨酸合成酶基因,各个不同色氨酸合成酶基因分别用trpA、trpB来表示。

  3.同一基因的不同突变位点用基因符号后面所加的阿拉伯数字表示,如果突变位点所属的基因还不确定,那么基因符号用一短线代替。

  例如:

trp各个突变型分别用trpA23、trpB46来表示。

  4.基因符号在不引起误会的情况下也可以作为突变型的符号,如果容易致误解,就应        -13-  第二章基因的结构  该在基因符号上加“+”或“-”表示。

  例如:

his-表示组氨酸合成酶缺陷型,his+表示相应的野生型。

  5.抗药性突变型基因符号可以在右上角加r表示抗性。

加s表示野生型基因。

例如:

strr表示链霉素抗性基因。

strs表示链霉素敏感的野生型基因。

基因命名的现状  随着基因组研究在全世界的广泛展开,基因片段命名中的混乱状况越来越明显。

有些基因片段明明在结构或者功能上相差甚远,但却有着完全相同的名称,而一些结构或者功能相似的基因片段却有着根本不能让人把它们联系起来的名字。

  挪威科学家艾温德·霍维格领导的研究小组利用计算机来统计分析学术期刊上发表的论文中的基因片段的命名情况。

截止2001年5月1日的时候,他们分析了Medline数据库中的近1000万条文献摘要,确定了22008个人类基因片段,结果发现10352个基因片段有不止一个名字。

  霍维格等分析的还仅仅是目前科学家们已经发现的人类的基因片段。

在跨种属的生物之间,基因片段命名就更混乱了。

  很多科学家都想将基因片段的命名标准化。

为此,相关领域的科学家曾举行了两次有关基因片段命名的研讨会,但科学家们研究领域的不同以及命名习惯的巨大差异使得要制定一个“放之四海而皆准”的命名标准实在不容易。

  一些知名的生物学家共同创立了一个名为“基因命名协会”的团体。

基因命名协会的工作目标就是希望未来能够利用计算机将基因组数据库中功能相近而名称不同的基因片段链接起来,以使查阅数据库的科学家能尽量准确全面地获取所需要的数据。

  目前,基因命名协会已经得到了果蝇基因组数据库、酵母菌基因组数据库、鼠基因组数据库、蠕虫基因组数据库等多个数据库的支持。

他们都按照基因命名协会的方法归类命名自        -14-  第二章基因的结构  己的数据库中的基因片段,并且将相关信息反馈到设于美国斯坦福大学的基因命名协会的中央服务器上。

此外,各个数据库还根据相应领域的研究进展动态修订自己对基因片段的命名。

基因命名协会希望,未来能有更多的基因组数据库加入到他们的团体当中来。

人类基因命名  人类基因命名委员会(HumanGeneNomenclatureCommittee,HGNC)  网址基因命名的发展趋势        -15-  第二章基因的结构  人类基因的命名不仅仅只与人类基因相关。

基因通过同源性分析而来的同源基因往往借用其它物种中同源基因的名字。

一些基因家族和超家族有自己专门的命名体系。

因此不同物种命名委员会之间及命名委员会与家族或超家族命名体系间的相互协调对于提高命名有用性,减少命名的管理费用及方便用户查询是必不可少的。

  第二节基因组概述  一、基因组概念    生物个体或细胞中信息不重复的遗传物质总和称为基因组。

例如人:

22常+X,Y,+线粒体基因组  二、DNA的C值  生物单倍体基因组的DNA含量总是恒定的,它称为该物种DNA的C值。

C值是每一物种的一个特征。

  三、C值矛盾  1.人们无法用已知功能来解释基因组如此之大的DNA含量。

2.生物基因组大小同生物在进化上所处地位的高低没有关系。

  一般地,随着生物体复杂性的增加,每个物种所需的最小基因数目也必然增加。

但生物体实际DNA含量远远大于该生物体所需最小基因数。

把每一类生物中的最小基因组作比较,其结果可以看出:

  显花植物鸟类  哺乳类      -16-爬行类两栖类骨鱼类软骨鱼类    第二章基因的结构      1.从原核生物到哺乳动物其最小基因组的大小是递增的。

  2.每类生物的最小基因组的大小基本上对应于生物在进化上所处地位的高低。

3.进化地位高、形态结构复杂程度高的一类生物其最小基因组也较大。

  4.基因组的DNA含量与低等真核生物的形态复杂性有很大的相关性。

但在高        -17-

  

      第二章基因的结构  等真核生物中则变化很大。

  5.从总体上说,生物基因组大小同生物在进化上所处地位的高低没有关系。

  第三节原核生物基因组    一、原核生物基因组的结构特点  1.基因组DNA分子量小。

  2.基因组的主体为单个环状染色体,只有一个DNA复制的起点。

3.重复序列少。

一般细菌中只有rRNA基因等少数重复基因。

4.不编码的DNA序列少。

  5.广泛存在操纵子结构:

原核基因组中,几个功能相关的结构基因及其调控区组成  一个基因表达的协同单位,这种单位称为操纵子。

  二、原核生物复制有关的结构  原核生物复制的特点  1.大肠杆菌基因组以双链环状DNA分子的形式存在,其DNA复制的中间产物可形成一个θ。

  2.复制从一个固定的起点开始,双向等速进行,形成两个复制叉。

3.复制起始后,两个复制叉在距起始点1800处会合。

4.原核生物起点可连续发动复制。

        -18-  第二章基因的结构    原核生物复制起始点  称为oriC,245个bp构成,其序列和控制元件在细菌中十分保守。

关键序列在于两组短的重复。

  四个9bp序列:

为DnaA蛋白的结合位点,大约20-40个DnaA蛋白各带一个ATP结合在此位点上,并聚集在一起,DNA缠绕其上,形成起始复合物。

  三个13bp的序列:

HU蛋白是细胞的类组蛋白,可与DNA结合,促使双链DNA弯曲。

受其影响,邻近三个成串富含AT的13bp序列被变性,成为开链复合物。

    DnaB结合于解链区,解开DNA双链,此时成为前引发复合体。

DNA双链解开还需拓扑异构酶II和SSB,前者可消除解螺旋酶产生的张力,后者保护单链并防止恢复双链。

引物酶合成RNA引物,并开始DNA的复制。

        -19-  第二章基因的结构    原核生物复制的终止区    大肠杆菌终止区有6个终止子位点,每个约22bp,分别为terA-terF。

与ter结合的蛋白质称为Tus。

  Tus-ter复合物只能阻止一个方向的复制叉前移,即不让对侧复制叉超过中点后过量复制。

  两个复制叉在终止区相遇并停止复制,其间大约有50-100bp未被复制。

其后两条亲代链解开,通过修复方式填补空缺。

        -20-  第二章基因的结构  此时两环状染色体互相缠绕,形成连锁体。

此连锁体的解开需要拓扑异构酶IV的参与,每次作用可以使DNA两链断开和再连接,因此使两个闭锁的环状双链DNA彼此解开。

  三、原核生物转录有关的结构  转录模板  DNA双链中按碱基配对规律能指引转录生成RNA的一股单链,称为模板链(templatestrand),也称作反意义链。

相对的另一股单链是编码链(codingstrand),也称为有意义链。

不对称转录  1.DNA链上只有部分的区段作为转录模板(反意义链或模板链)2.模板链并非自始至终位于同一股DNA单链上。

  DNA序列的书写  习惯上DNA的序列按其转录的RNA同样序列的一条链来书写,左到右相当于5’→3’方向。

转录的起始核苷酸为+1,从转录的近端向远端计数。

转录起点的左侧为上游,用负的数码来表示,起点前一个核苷酸为负1,起点后为下游,即转录区。

转录单位  启动部位:

转录起始之前,有特殊核苷酸顺序组成启动部位,也称为启动子,是RNA聚合酶识别、结合并启动转录的特异部位。

  终止部位:

末端也有特异结构作为终止部位,也称终止子。

        -21-  第二章基因的结构  RNA编码顺序:

就是起始与终止部位间的范围。

    1.启动子  -10区:

6-8个核苷酸组成,-10区有助于DNA局部双链的解开。

  -35区:

一般10个核苷酸组成,一般认为-35区是RNA聚合酶识别和结合的位点。

-35区在很大程度上决定启动子的强弱,RNA聚合酶很容易识别强启动子。

  非转录前导顺序:

不同的启动子在他们的3’末端有不同长度的非转录前导顺序,即+1到-10区的间距,一般是5-10个核苷酸。

前导顺序过长或过短,会影响转录效率。

  在-10区和-35区之间的碱基并不特别重要,但这两个序列之间的距离却很重要。

实验表明,两个序列之间为17bp时,转录效率最高。

2.终止子    弱终止子:

依赖Rho(?

)因子的转录终止。

DNA模板上靠近终止处,有些特殊的碱基序        -22-

  

  

  

      第二章基因的结构  RNA聚合酶I识别的启动子为类别I启动子,主要控制rRNA前体基因的转录,启动子两部分组成:

  ?

核心启动子:

位于转录起点附近,从-45至+20,有富含GC的区域。

?

上游控制元件:

位于-180至-107,也有富含GC的区域。

  RNA聚合酶Ⅲ转录的启动子为类别Ⅲ启动子,涉及一些小分子的转录。

5S和tRNA以及胞质小RNA基因的启动子位于转录起点的下游。

核内小RNA基因的启动子位于转录起点的上游。

无论上游启动子还是下游启动子都一些为转录因子识别的元件所组成,在转录因子的指引下RNA聚合酶Ⅲ方结合其上。

  五、真核生物翻译有关的结构  核糖体  mRNA特定的结构    ?

真核生物起始密码子只有AUG,三种终止密码子UAG、UGA和UAA的终止效率  似乎差别不大。

?

真核生物无SD序列。

        -33-  第二章基因的结构  ?

大多数mRNA带有5’帽子结构和3’多聚腺苷酸尾巴。

  第五节病毒基因组  一、病毒的相关知识  病毒的特点  病毒不具有细胞结构,一些简单的病毒仅核酸和蛋白质外壳组成。

  病毒是严格的细胞内寄生物,在生活的细胞内,病毒核酸提供遗传信息,利用宿主细胞的酶、能量合成系统、核糖体、细胞因子以及大分子合成的前体来完成自身的生命活动。

病毒的宿主范围  病毒能够感染并在其中复制的宿主种类和组织细胞种类称为病毒的宿主范围。

根据宿主范围将病毒分三类:

  1.噬菌体类:

从原核生物中分离到的病毒。

  2.植物病毒:

以植物为宿主的病毒。

在藻类植物和真菌中都发现有病毒的存在,它们  分别称作噬藻体和真菌噬菌体或称真菌病毒。

  3.动物病毒:

广义的动物病毒包括原生动物病毒、无脊椎动物病毒和脊椎动物病毒。

病毒的核酸类型  1.双链DNA:

其DNA序列与mRNA序列相同,即为正极性,称为正链DNADNA。

如果其核苷酸序列与mRNA互补,即为负极性,即负链DNADNA。

  2.单链DNA:

3.双链RNA:

  4.单链RNA:

病毒RNA可作为mRNA直接进行翻译,则为正极性,称为正链RNARNA。

  5.单链RNA:

病毒RNA的核苷酸序列与mRNA序列互补,则称为负链RNA        -34-  第二章基因的结构  RNA。

  6.双倍体,单链RNA:

病毒的大分子合成  早期转录:

发生在病毒核酸复制以前的转录称为早期转录,所转录的基因称作早期基因,早期基因编码的早期蛋白主要是参与病毒核酸复制、调节病毒基因组转录,以及改变或抑制宿主细胞大分子合成的蛋白质。

  晚期转录:

在病毒核酸开始复制或复制后所进行的转录为晚期转录,所转录的基因称作晚期基因,晚期基因编码的蛋白主要构成子代毒粒所需要的结构蛋白。

  根据病毒大分子合成过程中所发生事件的时间顺序,可将此过程分为三个连续阶段:

  病毒早期基因表达。

  病毒基因组的复制。

  病毒晚期基因的表达。

相关概念  1.裂解循环:

大多数噬菌体感染宿主细胞后,都能在细胞内正常复制并最终杀死细胞释放出来,这类复制循环称为噬菌体的裂解循环。

  2.烈性噬菌体:

能引起裂解循环的噬箘体。

  3.溶源性:

有些噬菌体感染宿主细胞后,不能完成复制循环,噬菌体基因组长期存在于宿主细胞内,没有成熟子代噬菌体产生,这一现象称作溶源性。

  4.溶源性噬菌体:

也称温和噬菌体,能够导致溶源性发生的噬菌体。

5.原噬菌体:

在大多数情况下,温和噬菌体的基因组都整合于宿主的染色体中,也有少数是以质粒形成存在。

整合于细菌染色体或以质粒形式存在的温和噬菌体基因组称作原噬菌体。

        -35-  第二章基因的结构  6.溶源性细菌:

细胞中含有以原噬菌体状态存在的温和噬菌体基因组的细菌。

    二、病毒基因组的结构特点  1.每种病毒只含有一种核酸,以DNA或RNA的单链或双链形式存在。

2.除逆转录病毒外,所有病毒均为单倍体。

  3.一般一条核酸链构成,少数RNA病毒的基因组几个片段组成。

4.有基因重叠现象。

  5.一般情况下,噬菌体的基因是连续的,真核病毒的基因是断裂的。

6.间隔顺序或调控顺序较少。

  三、动物DNA病毒  动物DNA病毒的结构特征  动物DNA病毒大多数为双链DNA,小部分为单链DNA,可呈线性或环状。

线性DNA病毒在其基因组中均含有反相重复顺序,DNA病毒基因组一般比RNA病毒基因组大,生活史也更复杂。

  动物DNA病毒的两种感染方式  增殖性或裂解性感染:

发生在病毒能在其内完成复制循环的允许细胞内,并以有感染性病毒子代产生为特征。

        -36-  第二章基因的结构  中断性感染(abortiveinfection):

感染发生在非允许细胞中,病毒繁殖很差或不能繁殖,但可引起小部分细胞的转化。

  动物DNA病毒引起细胞转化的机制  1.病毒DNA插入了宿主染色体上的基因表达调控区或插入基因导致宿主基因表达失常。

  2.病毒本身的基因产物可以引起宿主细胞的转化。

猴空泡病毒SV40双链环状DNA,5243bp,包括:

  早期转录区:

2个重叠基因编码蛋白质t和T  调控区:

位于早、晚期基因之间,大约400bp,包括复制起始点,启动子,增强子。

晚期转录区:

3个重叠基因,编码衣壳蛋白VP1VP2和VP3  四、动物RNA病毒  动物RNA病毒的结构特征  动物RNA病毒的核酸结构具有几种形式。

最常见的是单链RNA,其中少数病毒RNA于末端重复形成发夹结构。

有些单链RNA病毒含有节段性基因组,即基因组包含数条RNA链,各自携带一部分遗传信息。

逆转录病毒是动物RNA病毒中较特殊的一种,含有2个相同的RNA链,属于双倍体。

逆转录病毒基因组结构  基因组为双倍体,两条(+)RNA链构成,每条RNA链含5’端的帽和3’端多聚腺苷酸的尾。

两条RNA链的5’端氢键连接。

在其基因组中还含有来自宿主细胞的2个tRNA,四条链之间借氢键彼此相连。

        -37-

  

      第二章基因的结构  编码区:

所有逆转录病毒均含有3个基本结构基因  —gag:

主要结构蛋白基因  —pol:

逆转录酶  —env:

被膜表面糖蛋白  一部分病毒还含有病毒癌基因,它编码与细胞恶性转化有关的转化蛋白。

  非编码区:

与基因组复制和基因表达有关  —R区:

两端的重复序列,与cDNA合成有关  —引物结合区(primerbindingsite,PB)  —U区:

U3含强启动子,起始转录RNA.  U5与转录终止和加polyA有关    第六节  人类基因组计划  (humangenomeproject,HGP)  一、简介  人类基因组计划是美国科学家于1985年率先提出,于1990年正式启动的。

美国、英国、法国、德国、日本和我国科学家共同参与了这一价值达30亿美元的计划。

这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。

  二、为什么选择人类的基因组进行研究?

  因为人类是在“进化”历程上最高级的生物,对它的研究有助于认识自身、掌握生老病死规律、疾病的诊断和治疗、了解生命的起源。

  在人类基因组计划中,还包括对五种生物基因组的研究:

大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。

        -38-  第二章基因的结构  三、人类基因组计划的启动  1986年,诺贝尔奖获得者RenatoDulbecco发表了短文?

?

《肿瘤研究的转折点:

人类基因组测序》。

指出:

“如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。

  1990年,美国国会批准美国的“人类基因组计划”在10月1日正式启动。

预计用15年时间,投入至少30亿美元,完成HGP。

国立卫生研究院和能源部共同组成“人类基因组研究所”  逐渐地,HGP扩展为多国协作计划。

参与者包括:

英、日、法、德和中国。

  四、人类基因组计划的进展状况  测序技术飞速提高  世界最大的DNA自动测序仪厂家与遗传生物学家CraigVenter教授共同组建了Celera公司,宣称将在无政府投资的条件下早于多国合作小组完成人类基因组计划。

接着又有若干家公司成立,总共投入资金约几十亿美元,形成“公”“私”并进格局。

2.截至1998年10月,完成×108bp,占计划的6%。

3.  完成并公布人类基因组工作框架图(90%)。

4.人类基因组“精细图”完成(99%)。

  5.,人类基因组序列图亦称“完成图”提前绘制成功。

  人类基因组草图基本信息人类基因组  ?

亿bp组成?

含3-万基因        -39-  第二章基因的结构  ?

与蛋白质合成有关的基因占2%人类蛋白质  ?

61%与果蝇同源?

43%与线虫同源?

46%与酵母同源  五、人类基因组计划的科学意义  1.确定人类基因组中约5万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。

  2.了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。

  3.从整体上了解染色体结构,包括各种重复序列以及非转录“框架序列”的大小和组织,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中的影响与作用。

  4.研究空间结构对基因调节的作用。

有些基因的表达调控序列与被调节基因从直线距离上看,似乎相距甚远,但若从整个染色体的空间结构上看则恰恰处于最佳的调节位置,因此,有必要从三维空间的角度来研究真核基因的表达调控规律。

  5.发现与DNA复制、重组等有关的序列。

DNA的忠实复制保障了遗传的稳定性,正常的重组提供了变异与进化的分子基础。

局部DNA的推迟复制、异常重组等现象则导致疾病或者胚胎不能正常发育,因此,了解与人类DNA正常复制和重组有关的序列及其变化,将对研究人类基因组的遗传与进化提供重要的结构上的依据。

  6.研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引发的分子病理学改变及其进程,为这些疾病的诊断、预防和治疗提供理论依据。

        -40-  第二章基因的结构  7.确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。

了解有关病毒基因组侵染人类基因组后的影响,可能指导人类有效地利用病毒载体进行基因治疗。

  8.研究染色体和个体之间的多态性。

这些知识可被广泛用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。

此外,这些遗传信息还有助于研究人类历史进程、人类在地球上的分布与迁移以及人类与其他物种之间的比较。

            霍锐编      问师西来意排          -41-

  

  

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 临时分类 > 批量上传

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2