生物信息学软件.docx
《生物信息学软件.docx》由会员分享,可在线阅读,更多相关《生物信息学软件.docx(19页珍藏版)》请在冰点文库上搜索。
生物信息学软件
目录
生物信息学软件(X10001)…………………………………………………………………
1
生物信息挖掘技术(X10002)………………………………………………………………
3
功能基因组学(X10003)……………………………………………………………………
5
统计遗传学研究进展(X10004)………………………………………………………
7
生物芯片表达谱分析技术(X10005)………………………………………………………
9
医用多因素分析(X10006)………………………………………………………………
11
医学结构生物信息学(X10007)…………………………………………………………
13
SCI论文与学位论文写作(学院自开课程)………………………………………………
16
生物信息学软件
Bioinformaticssoftware
课程编号:
X10001
开课教研室:
生物信息教研室
总学时数:
20学时
学分:
1学分
主讲教师:
肖云
开课学期:
第1学期
教材名称:
生物信息学
出版社:
人民卫生出版社
出版时间:
2010年
主编:
李霞
课程简介:
生物信息学软件主要是为研究生开设的基础课。
课程内容为生物信息相关专业课程(,课程内容的体系结构涉及功能注释、表达分析以及网络分析等,主要为培养我院各专业研究生灵活运用软件解决问题的能力,使学生通过本课程的学习,能够熟练掌握一些主要的生物信息学软件。
教学目的:
该门课程学习的目的,是使学生熟练掌握一些应用广泛的生物信息学软件,并能运用所学软件分析和解决生物信息科研中的实际问题。
本课程从多个层面覆盖生物信息各方面常用的软件,如生物学功能注释、系统生物学分析等。
本课程重点讲授Cytoscape及其插件的应用。
教学重点及要求掌握的内容:
一、注释软件Biomart(2学时)
1.简介bioMart是一个集成了生物学数据的大型集成数据库,包括Ensemble,Uniprot,NCBI,EBI,TAIR等常用的数据库
2.主要功能它可以轻松地完成的在多个生物学数据库上繁琐地检索,获取相关数据在不同数据库间的关联。
3.实例分析查找某个基因在染色体上的位置。
反之,给定染色体每一区间,返回该区间的基因s
二、功能分析软件David(2学时)
1.主要功能主要用于基因的功能富集分析,包括GO富集分析以及KEGG通路富集分析.
2.实例分析给定某一基因集合,分析其显著参与的生物学过程
三、网络可视化与分析软件Cytoscape及其插件(16学时)
1.简介Cytoscape是一个开源的生物信息软件平台,它可以对分子互作网络及生物学通路进行可视化分析,并且可以根据需要将网络相关的注释信息、基因表达谱和其他类型的数据整合到网络中。
2.主要功能
a)可视化蛋白质互作、转录调控网络
b)对网络进行基础分析,如度,聚类系数等
c)对网络进行模块划分
3.实例分析从任意一互作数据库中下载互作数据,并从GEO上下载一套case/control表达谱数据进行差异表达分析,最后利用软件把差异表达基因在映射到互作网络中并进行可视化。
4.插件介绍BiNGO,APCluster,MCODE,OmicsAnalyzer,NetworkAnalyzer,RandomNetworks
参考书目及文献:
1.Durinck,S.,Moreau,Y.,Kasprzyk,A.,Davis,S.,DeMoor,B.,Brazma,A.andHuber,W.(2005)BioMartandBioconductor:
apowerfullinkbetweenbiologicaldatabasesandmicroarraydataanalysis,Bioinformatics,21,3439-3440.
2.Maere,S.,Heymans,K.andKuiper,M.(2005)BiNGO:
aCytoscapeplugintoassessoverrepresentationofgeneontologycategoriesinbiologicalnetworks,Bioinformatics,21,3448-3449.
3.Shannon,P.,Markiel,A.,Ozier,O.,Baliga,N.S.,Wang,J.T.,Ramage,D.,Amin,N.,Schwikowski,B.andIdeker,T.(2003)Cytoscape:
asoftwareenvironmentforintegratedmodelsofbiomolecularinteractionnetworks,GenomeRes,13,2498-2504.
4.Xia,T.andDickerson,J.A.(2008)OmicsViz:
Cytoscapeplug-inforvisualizingomicsdataacrossspecies,Bioinformatics,24,2557-2558.
生物信息挖掘技术
BiologicalDataMiningTechniques
课程编号:
X10002
开课教研室:
生物信息学教研室
总学时数:
20学时
学分:
1学分
主讲教师:
李霞
开课学期:
第1学期
教材名称:
生物信息学
出版社:
人民卫生出版社
出版时间:
2010年
主编:
李霞
课程简介:
随着基因组、蛋白质组及转录组研究的不断进展,各级各类的生物学数据库相继出现,从而产生了高通量、大规模的生物学数据。
本课程主要介绍在对对这些生物分子信息进行获取、管理之后如何进行分析和应用,并采用数据挖掘技术从海量数据中发现有价值的规律,揭示其生物学奥秘。
同时介绍了R语言中的部分软件包在生物信息挖掘技术上的实现。
教学目的:
通过本课程学习,使学生深入掌握生物信息挖掘的基础理论和基本技术,熟悉生物数据挖掘领域的发展趋势,了解生物数据挖掘技术的最新进展和前沿成果,并能根据实际问题给出相应的解决方案。
教学重点及要求掌握的内容:
一、生物信息挖掘方法概述(2学时)
1.决策树与决策森林
2.ANN
3.SVM
4.遗传算法
5.常见聚类方法
6.常见统计学分析方法
7.常见的生物学网络构建方法
二、生物信息学挖掘方法应用(10学时)
1.疾病相关基因与疾病基因子网挖掘新方法
(1)集成决策的方法挖掘疾病相关基因
(2)遗传算法与SVM耦合的方法挖掘疾病基因
(3)启发式搜索算法挖掘疾病基因子网
2.生物学模块挖掘方法
(1)基于群体的概率学习方法挖掘microRNA–mRNA调控模块
(2)模块方法整合分析基因表达和药物反应数据
3.药物-靶挖掘方法
(1)整合化学结构与基因组序列信息预测药物-靶的互作网络
(2)药物-靶互作网络
三、R语言实现(8学时)
1.集成决策的方法party可以用于递归划分计算工具包的核心是ctree(),条件推理树的实现是把基于树的回归模型嵌入到研究很好的条件推理过程理论。
这个非参数的回归树可以应用于各种回归模型:
包括名义上、顺序、数值的,检查以及多变量和协变量的任意度量。
基于条件推论树,cforest()实现了Breiman的随机森林。
mob()实现了基于参数模型(如线性模型,广义线性回归或生存分析)递归划分,该方法利用参数不稳定检验来检测划分选择。
可以对基于树回归模型可视化。
2.SVM方法e1075包中SVM是用来训练支持向量机的方法,它可用于一般回归和分类,还可以用于密度估计。
参考书目及文献:
1.LiX,RaoS,WangY,GongB(2004)Genemining:
anovelandpowerfulensembledecisionapproachtohuntingfordiseasegenesusingmicroarrayexpressionprofiling.NucleicAcidsRes32:
2685-2694.
2.LiL,JIangW,LiX,MoserKL,GuoZ,etal.(2005)Arobusthybridbetweengeneticalgorithmandsupportvectormachineforextractinganoptimalfeaturegenesubset.Genomics85:
16-23.
3.ChuangHY,LeeE,LiuYT,LeeD,IdekerT(2007)Network-basedclassificationofbreastcancermetastasis.MolSystBiol3:
140.
4.JoungJG,HwangKB,NamJW,KimSJ,ZhangBT(2007)DiscoveryofmicroRNA-mRNAmodulesviapopulation-basedprobabilisticlearning.Bioinformatics23:
1141-1147.
5.KutalikZ,BeckmannJS,BergmannS(2008)Amodularapproachforintegrativeanalysisoflarge-scalegene-expressionanddrug-responsedata.NatBiotechnol26:
531-539.
6.YamanishiY,ArakiM,GutteridgeA,HondaW,KanehisaM(2008)Predictionofdrug-targetinteractionnetworksfromtheintegrationofchemicalandgenomicspaces.Bioinformatics24:
i232-240.
7.YildirimMA,GohKI,CusickME,BarabasiAL,VidalM(2007)Drug-targetnetwork.NatBiotechnol25:
1119-1126.
8.KlippE,WadeRC,KummerU(2010)Biochemicalnetwork-baseddrug-targetprediction.CurrOpinBiotechnol.
功能基因组学
FunctionalGenomics
课程编号:
X10002
开课教研室:
生物信息学教研室
总学时数:
20学时
学分:
1学分
主讲教师:
李霞
开课学期:
第1学期
教材名称:
生物信息学
出版社:
人民卫生出版社
出版时间:
2010年
主编:
李霞
课程简介:
(150-200字)
功能基因组学是后基因组研究的核心内容,它强调发展和应用整体的(基因组水平或系统水平)实验方法分析基因组序列信息阐明基因功能,特点是采用高通量的实验方法结合的大规模数据统计计算方法进行研究,基本策略是从研究单一基因或蛋白上升到从系统角度一次研究所有基因或蛋白。
随着功能基因组实验研究的深入,大量的数据不断涌现,生物信息学将在功能基因组学研究中的扮演关键角色。
教学目的:
掌握和了解基因功能预测的计算方法,对功能基因组研究的理论和前沿问题有初步的了解。
教学重点及要求掌握的内容:
一、功能基因组学概述(1学时)
1.功能基因组学研究的主要方向
2.功能基因组学研究的主要方法和理论
二、基因功能预测的计算方法(13学时)
1.基于DNA和蛋白质序列的功能预测
2.基于蛋白质结构的功能预测
3.基于基因组信息和进化分析的功能预测
4.基于基因表达分析的功能预测
5.基于蛋白质网络和系统生物学的功能预测
三、功能基因组学前沿文献讲读(6学时)
1.Proteinnetworksindisease
2.Themodelorganismasasystem:
integrating‘omics’datasets
3.Humandiseaseclassificationinthepostgenomicera:
Acomplexsystemsapproachtohumanpathobiology
4.Network-basedclassificationofbreastcancermetastasis
5.Comparingfluxbalanceanalysistonetworkexpansion:
producibility,sustainabilityandthescopeofcompounds
参考书目及文献:
(参照下列例子格式)
1.李霞、李亦学,《生物信息学》,人民卫生出版社,2010年。
2.Proteinnetworksindisease
3.Themodelorganismasasystem:
integrating‘omics’datasets
4.Humandiseaseclassificationinthepostgenomicera:
Acomplexsystemsapproachtohumanpathobiology
5.Network-basedclassificationofbreastcancermetastasis
6.Comparingfluxbalanceanalysistonetworkexpansion:
producibility,sustainabilityandthescopeofcompounds
7.周集中,《微生物功能基因组学》,化学工业出版社,2007年。
统计遗传学研究进展
ProgressinStatisticalGenetics
课程编号:
X1004
开课教研室:
统计遗传学教研室
总学时数:
20学时
学分:
1学分
主讲教师:
张瑞杰教授
开课学期:
第1学期
教材名称:
统计遗传学
出版社:
科学出版社
出版时间:
2004年
主编:
顾万春
课程简介:
随着人类基因组计划和人类单体型计划的逐步实施,复杂性状尤其是人类复杂疾病的遗传学机制研究得到了飞速发展。
本课程结合当今国际最前沿的科研进展,在连锁分析、全基因组关联分析、单体型分析以及其中非常关键的多重检验校正问题等方面做了详细的讲解,并对未来可能的一些研究方向进行了展望。
教学目的:
通过本课程的学习,使学生了解统计遗传学的最新研究进展,为今后进行统计遗传学相关科研工作打下基础。
教学重点及要求掌握的内容:
一、第一讲 连锁分析与关联分析最新进展(4学时)
1、LOD方法与亲属对方法简单回顾
2、方差组分关联分析模型
3、连锁分析方法的比较及应用举例
第二讲 单体型分析最新进展(4学时)
1、连锁与连锁不平衡
2、常用单体型的识别方法及软件
3、全基因组单体型分析方法
4、人类复杂疾病相关单体型数据库(CDRH)介绍
第三讲 多重检验校正的原理及方法(4学时)
1、多重检验校正在生物信息学中的重要性
2、Bonferroni多重检验校正方法
3、FDR原理和方法
4、常用FDR软件介绍(Fdrtool)
第四讲 全基因组关联分析及最新进展(4学时)
1、全基因组关联分析方法基本流程
2、下一代测序技术对全基因组关联分析的影响
3、Meta-analysisofgenome-wideassociation
第五讲 系统遗传学研究方法(4学时)
1、eQTL研究方法
2、结合GO、KEGG的系统遗传学方法
3、Thegeneticsofquantitativetraits:
challengesandprospects
参考书目及文献:
1.胡永华,《医学流行病学》,北京大学医学出版社,2008年。
2.TrudyF.C.Mackay,EricA.StoneandJulienF.Ayroles(2009)Thegeneticsofquantitativetraits:
challengesandprospects.NatureReviews|Genetics,volume10,August2009
生物芯片表达谱分析技术
BiochipExpressionProfileAnalysisTechnology
课程编号:
X10005开课教研室:
系统生物学教研室
总学时数:
20学分:
1
主讲教师:
郭政开课学期:
第1学期
教材名称:
自编讲义
课程简介:
本课程讲述生物芯片从概念的提出及发展过程,系统介绍基因芯片的原理、类型、制备、检测、数据存储管理与处理分析以及在基因表达、基因多态性、病原体检测、新药筛选等方面的应用,最后对其他生物芯片也做一定介绍和展望。
主要教授基因芯片表达谱数据库的相关知识以及以此为数据源的几种科研分析软件的用法。
教学目的:
了解生物芯片(重点基因芯片)的原理、制备、数据检测、数据处理与分析。
教学重点及要求掌握的内容:
一、简略讲解芯片的杂交和探针筛选原理(4学时)
1.微珠芯片原理简介
2.Affymatrix芯片原理简介
二、差异表达基因筛选方法及相关软件(4学时)
1.SignificanceAnalysisofMicroarrays
2.Arraytool简介
三、基因、蛋白质功能注释与分类体系以及功能模块筛选方法及相关软件(4学时)
1.GeneOntology计划
2.蛋白质互作网络以及其拓扑特征
四、基因与蛋白质功能研究的生物芯片信息学技术(4学时)
1.条件相关的蛋白质互作子网络
2.组织特异的蛋白质互作子网络
五、生物信息融合分析技术(4学时)
1.如何结合基因表达信息解析蛋白质互作网络,识别条件特异应答子网,发现其功能模块化组织关系
2.结合基因表达谱与蛋白质互作网络,介绍基于实验条件相关功能模块的基因功能预测算法。
参考书目:
1.MarkSchena.MicroarrayAnalysis,Wiley-Liss,JohnWiley&Sons,Inc.,2003.
2.蒋知俭.《医学统计学》.人民卫生出版社,1999年
3.郭政,李霞,饶绍奇.《医学信息分析方法》.哈尔滨出版社,2001
医用多因素分析
MedicalMultivariateStatisticsAnalysis
课程编号:
X10006
开课教研室:
统计遗传学教研室
总学时数:
20学时
学分:
1学分
主讲教师:
张瑞杰教授,张岩教授
开课学期:
第1学期
教材名称:
医学统计学
出版社:
人民卫生出版社
出版时间:
2002年
主编:
孙振球
课程简介:
本课程对多因素分析方法在医学上的应用进行了系统的介绍,包括Logistic回归分析的基本原理、Logistic回归模型的建立和检验、配对病例对照研究的的条件Logistic回归分析、多元Logistic回归分析在基因型和表型联系的应用、主成分分析和因子分析、生存分析的基本概念、生存率估计及其区间估计、生存曲线的比较、Cox比例风险回归模型。
详细讲解了基因集分析方法的原理、常用软件及应用。
此外本课程还介绍了生物信息学的一些方法在表观遗传领域的应用及相关数据库。
教学目的:
通过本课程的学习,使学生掌握多因素分析的相关方法,并会应用这些方法解决相关的医学及生物信息学问题。
教学重点及要求掌握的内容:
一、Logistic回归分析、主成分分析和因子分析方法及其在医学上的应用(4学时)
1.多元Logistic回归分析及配对病例对照研究的条件Logistic回归分析原理
2.Logistic回归分析在基因型与表型联系的应用,SAS软件的简介,应用SAS软件进行回归分析
3.主成分分析,因子分析基本原理
4.主成分分析与因子分析应用实例,利用SAS软件对医用统计数据进行主成分分析和因子分析的方法介绍
二、生存分析(4学时)
1.生存分析的基本概念
2.生存率估计及生存率区间估计
3.生存曲线的比较
4.Cox比例风险回归模型
三、基因集分析方法(4学时)
1.单基因分析与基因集分析
2.基因集分析中的两个零假设及模型
3.基于基因和类别标签两种permutation方法
4.常见基因集分析软件及比较
5.SNP基因集分析方法简介
四、生物信息学方法在计算表观遗传学研究中的应用(4学时)
1.计算表观遗传学发展简介
2.DNA甲基化芯片数据的处理方法
3.最新DNA甲基化分析软件
4.基于高通量测序技术识别组蛋白修饰谱
5.基于组蛋白修饰预测基因表达的方法
五、与癌症相关的表观遗传谱矩阵分析(4学时)
1.表观遗传学与癌症
2.癌症差异甲基化区域的筛选方法及分析
3.常用的癌症表观遗传学相关的数据库介绍
参考书目及文献:
1.于秀林,任雪松编著,多元统计分析,中国统计出版社,2005
2.北野宏明编,刘笔锋,周艳红等译,系统生物学基础,化学工业出版社,2007
3.贺福初,杨芃原,朱云平主译,系统生物学的理论,方法和应用,复旦大学出版社,2007
4.表观遗传学,C.D.艾利斯,科学出版社,2008
医学结构生物信息学
StructuralBioinformaticsinMedicalResearch
课程编号:
X10007
开课教研室:
生物物理学教研室
总学时数:
20学时
学分:
1学分
主讲教师:
陈丽娜
开课学期:
第1学期
教材名称:
结构生物信息学
出版社:
化学工业出版社
出版时间:
2009年3月
主编:
B.E波恩H.魏西希
课程简介:
生物系统的高分辨结构信息将允许我们对生命系统的功能、对系统修饰或扰动的后果进行精确的解释和推理。
这一结构信息的展现与日益增长的基因组、蛋白组、代谢组信息相联系,为分析生物医学问题提供了强大的研究背景。
本课程侧重以基础理论与科研实例相结合的方式,介绍特定结构生物分子在生物通路和重要细胞过程中的作用;同时深入讲解结构生物学信息的方法,在复杂疾病基因挖掘、功能蛋白设计(药靶设计)及蛋白质功能预测等方面的应用。
教学目的:
通过本课程的学习,使学生了解结构生物信息学研究内容及方法,掌握常用的结构生物信息学数据库及相关软件的原理和使用方法,能够根据结构生物学数据