ImageVerifierCode 换一换
格式:DOCX , 页数:4 ,大小:18.29KB ,
资源ID:5566106      下载积分:1 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-5566106.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(核酸蛋白序列比对分析.docx)为本站会员(b****4)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

核酸蛋白序列比对分析.docx

1、核酸蛋白序列比对分析核酸蛋白序列比对分析核酸蛋白序列比对分析 生物技术 02级021402198 曾彪 摘要生物信息学是一门新兴的交叉学科,是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、存储、传递、检索、分析和解读的科学,是现代生命科学与计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。核酸与蛋白质序列分析是生物信息学的基本研究方法。核酸与蛋白质序列分析是生物信息学的基本研究方法。 关键词核酸/蛋白质序列分析生物信息数据与查询 序列比较 DNA芯片 质谱 隐马尔可夫模型 正文人类基因组计划完成了人类基因组的测序与分析工作,也积累了大量的核酸和蛋白质序

2、列数据,从而导致了分子数据库的建立。分子生物学家在此基础上依靠计算机进行核酸和蛋白质序列分析。 大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理。这些生物信息数据库可以分为一级数据库和二级数据库。一级数据库的数据都直接实验获得的原始数据,只经过简单的归类整理和注释;二级数据库是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步整理。国际上著名的一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT、PIR等;蛋白质

3、结构库有PDB等。国际上二级生物学数据库非常多,它们因针对不同的研究内容和需要而各具特色,如人类基因组图谱库GDB、转录因子和结合位点库TRANSFAC、蛋白质结构家族分类库SCOP等等。 要在如此庞大的数据库中找到所需要的目标序列,必须建立数据库查询系统。数据库查询是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。常用的数据库查询系统有Entrez, SRS等。数据库搜索是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。常用的数据库搜索系统有BLAST 、FASTA和BLITZ 。 面对大批测序仪产生的序列数据,通过序列分析,人

4、们能够了解这些序列的生物学信息和意义。线性核酸序列的分析主要包括同源比较,读框分析,酶切位点查找,GC比例分析,序列翻译,引物设计等;蛋白质序列分析包括同源比较,疏水性分析,序列模体识别,结构域识别,高级结构预测等。 核酸序列分析 核酸序列的基本分析 1.测定分子质量、碱基组成、碱基分布等基本数值; 2.序列变换:反向序列、互补序列、互补反向序列; 3.限制性酶切分析:限制酶的所有信息,包括甲基化酶、相应的微生物来源、识别序列位点、裂解位点、甲基化特异性、酶的商业来源以及技术,与传统测序技术相比,它的突出优点是整个检测过程快速高效。于探针阵列具有高度的序列多样性,它可以同时对大量基因、乃至整个

5、基因组进行扫描分析,从而能够使人们从一个更高的层次来全面研究基因的功能,分析不同基因之间的生物相关性 这些是传统的序列分析技术所无法企及的。随着这项技术的广泛应用,将会给分子生物学的发展带来深远的影响,特别是将在以研究基因定位和基因功能为主的后基因组计划中发挥越来越太的作用。 DNA 芯片是生物芯片的一种,也称为微阵列(Microarray),是指大量探针按一定的顺序排列在固相载体表面而形成的探针阵列,目前DNA 芯片主要包括eDNA 芯片和寡核苷酸芯片。探针阵列的合成目前主要有两种方式:(1)离片合成法(Off-Chip Synthesis);(2)在片原位合成法(OnChipin situ

6、 Synthesis)。DNA 芯片是通过核酸杂交原理来进行序列分析的,将标过的未知序列与芯片上的探针阵列进行杂交,严格控制反应条件,如靶序列浓度、杂交温度及缓冲溶液浓度等,那么与靶序列完全互补的探针显示比较强的杂交信号,利用高分辨率的检测装置检测出完全互补的探针,经过计算机系统分析处理,即可确定待测序列。 DNA 芯片可广泛应用于涉及DNA 序列分析的众多研究领域。目前DNA芯片技术主要应用于比较分析特定基因的遗传多样性,检测多态性位点用于基因定位,检测突变位点诊断遗传病,监测基因的表达水平,DNA 测序以及进行其它的序列比较等方面的研究。1 检测多态性突变位点利用DNA芯片技术,可以同时检

7、测众多基因乃至整个基因组的多态性突变位点。在用寡核苷酸芯片扫描分析特定基因时,针对不同的检测目的,可以设计台成出不同形式的探针阵列,将待分析序列与这四个探针同时杂交,严格控制杂交条件,那么完全互补探针的杂交信号最强,从而可以确定位点;2 DNA 测序SBH(Sequencing by Hybridizati0n)法是近年来提出的一种新的DNA 测序方法,它用一系列较短的已知序列的寡核苷酸探针,与较长的待分析序列杂交,寻找其互补序列,根据杂交结果分析待测DNA 序列。 人类基因组计划的实施,对现代分析科学提出了严峻挑战,同时也给分析科学的发展带来了巨大的机遇,促进了分析科学与众多相关学科的渗透融

8、合。DNA芯片技术正是在此基础上发展起来的一种全新的DNA 序列分析技术,这一技术已在分子生物学的许多研究领域显示了巨大的潜力和诱人的应用前景。目前DNA 芯片技术的研究与应用正处在一个迅猛发展、日趋完善阶段,在不断拓展其新的应用领域的同时,还需要进一步提高探针阵列的合成密度以及检测系统的分辨率与灵敏度,更重要的是要使这项技术逐步实现常规化与自动化。随着这一技术的逐步完善与广泛应用,将会在二十一世纪的分子生物学中发挥更大的作用。 质谱及隐马尔可夫模型在肽和蛋白质序列分析中的应用 了解肽和蛋白质的序列对理解其功能具有重要意义,测定其序列也是当前生命科学研究中的重要内容之一质谱作为高灵敏度的测定分

9、子结构的仪器,其高灵敏度、广泛的适用性及快速性等特性使它具有很大潜力发展成为辅助传统测序方法的新方法,并得到了广泛的关注肽和蛋白质序列的质谱测定方法质谱用于肽和蛋白质的序列测定主要可以分为三种方法一种方法叫蛋白图谱(protein mapping),即用特异性的酶解或化学水解的方法将蛋白切成小的片段,然后用质谱检测各产物肽分子量,将所得到的肽谱数据输入数据库,搜索与之相对应的已知蛋白,从而获取待测蛋白序列;第二种方法是利用待测分子在电离及飞行过程中产生的亚稳离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基其中亚 稳离子碎裂包括“自身”碎裂及外界作用诱导碎裂;第三种方法与FAman法有

10、相似之处,即用化学探针或酶解使蛋白或肽从N端或c端逐一降解下氨基酸残基,形成相互间差一个氨基酸残基的系列肽,名为梯状测序(1adder sequencing),经质谱检测,相邻峰的质量差知道相应氨基酸残基 隐马尔可夫模型(Hidden Markov model,HMM)用于蛋白质研究是生物信息学研究的新领域。目前,人们已经得到大量的蛋白质序列和结构数据,传统研究蛋白质的方法已经不再实用,生物学家已经转向能够处理大量数据的统计方法来进行研究。隐马尔可夫模型可以通过训练,识别同一特征的蛋白质序列。从SCOP数据库中选择了一个蛋白质族,它得到了能够代表该族特征的隐马尔可夫模型,并用该模型对一些蛋白质

11、序列进行分析。隐马尔可夫模型(Hidden Markov model,HMM)用于蛋白质研究是生物信息学研究的新领域,它的基础是计算机技术、统计学和分子生物学。HMM 可被用于蛋白质同源性的研究。它相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markov链,另一个是与Markov链的每一状态相关联的观察结果的随机过程。隐Markov链的特征要靠可观测到的信号揭示。编码蛋白质的原始DNA 序列,在生物的进化过程中,会受到自然环境和各种因素的影响,使翻译出的蛋白质序列经历突变,遗失,或引入外源序列等变化,最后按不同的进化路径分化,形成多种功能相近的蛋白质。因此,可以把这些蛋白质看作一个基本蛋白质序列经过插入,删除或替换了某些氨基酸残基而形成的。这个过程可以用HMM 来表示。HMM 可以用于已知一级结构进行蛋白质的分类,并且有较好的效果,是对其它预测和分类方法的补充。若结合各种蛋白质结构数据库,会产生更准确的预测结果。但它也存在一些缺陷,使得它用于结构分析方面有一定的不足。 结束语 核酸/蛋白质序列分析只是计算机在生物工程方面的应用,随着社会科技的发展,计算机与人们的日常生活和工作联系越来越密切,只有善于利用计算机的人,才能走在时代的前方。

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2