Mega软件的使用1文档格式.docx

上传人:b****1 文档编号:4441875 上传时间:2023-05-03 格式:DOCX 页数:70 大小:4.16MB
下载 相关 举报
Mega软件的使用1文档格式.docx_第1页
第1页 / 共70页
Mega软件的使用1文档格式.docx_第2页
第2页 / 共70页
Mega软件的使用1文档格式.docx_第3页
第3页 / 共70页
Mega软件的使用1文档格式.docx_第4页
第4页 / 共70页
Mega软件的使用1文档格式.docx_第5页
第5页 / 共70页
Mega软件的使用1文档格式.docx_第6页
第6页 / 共70页
Mega软件的使用1文档格式.docx_第7页
第7页 / 共70页
Mega软件的使用1文档格式.docx_第8页
第8页 / 共70页
Mega软件的使用1文档格式.docx_第9页
第9页 / 共70页
Mega软件的使用1文档格式.docx_第10页
第10页 / 共70页
Mega软件的使用1文档格式.docx_第11页
第11页 / 共70页
Mega软件的使用1文档格式.docx_第12页
第12页 / 共70页
Mega软件的使用1文档格式.docx_第13页
第13页 / 共70页
Mega软件的使用1文档格式.docx_第14页
第14页 / 共70页
Mega软件的使用1文档格式.docx_第15页
第15页 / 共70页
Mega软件的使用1文档格式.docx_第16页
第16页 / 共70页
Mega软件的使用1文档格式.docx_第17页
第17页 / 共70页
Mega软件的使用1文档格式.docx_第18页
第18页 / 共70页
Mega软件的使用1文档格式.docx_第19页
第19页 / 共70页
Mega软件的使用1文档格式.docx_第20页
第20页 / 共70页
亲,该文档总共70页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

Mega软件的使用1文档格式.docx

《Mega软件的使用1文档格式.docx》由会员分享,可在线阅读,更多相关《Mega软件的使用1文档格式.docx(70页珍藏版)》请在冰点文库上搜索。

Mega软件的使用1文档格式.docx

如下图所示:

根据遗传距离矩阵的类型,如果是下三角矩阵,选择“LowerLeftMatrix”即可;

如果是上三角矩阵,选择“UpperRightMatrix”即可。

点击“OK”按钮,即可导入数据。

如果是核苷酸数据,则读完之后,会弹出如下对话框:

如上图,如果是编码蛋白质的核苷酸序列,则选择“Yes”按钮;

如果是不编码蛋白质的核苷酸序列,则点击“No”按钮。

之后,会弹出如下操作窗口:

此作界面的名称是“SequenceDataExplorer”,在其最上方是工具栏“Data”、“Display”、“Highlight”等,然后是一些数据处理方式的快捷按钮,在操作界面的左下方是每个序列的名称。

显示序列占了操作界面的绝大部分,与第一个序列相同的核苷酸用“.”表示,发生变异的序列则直接显示。

如果在弹出的对话框中,点击“OK”,即选择输入的数据是编码蛋白质的DNA序列。

那么会再弹出如下对话框:

此操作界面提供了多种生物的遗传密码方式的选择,如VertebrateMitochondrial(脊椎动物线粒体)、InvertebrateMitochondrial(非脊椎动物线粒体)、YeastMitochondrial(酵母线粒体)等等。

点击此操作界面的“Add”按钮,可以添加密码子表格,其编辑界面如下图所示:

通过此操作界面可以创建、修改密码子表格。

点击“OK”按钮可以返回“SelectGeneticCode”操作界面。

点击“SelectGeneticCode”操作界面的“Delect”按钮,可以删除一个密码子表。

点击“SelectGeneticCode”操作界面的“Edit”按钮,可以对已经存在的密码子表格。

其操作界面与“GeneticCodeTable”相同。

点击“SelectGeneticCode”操作界面的“View”按钮,可以浏览选中的密码子表格。

点击“SelectGeneticCode”操作界面的“Statistics”按钮,可以统计密码子表格的一些信息,如每种密码子的频率、同义位点数、非同义位点数等。

点击点击“SelectGeneticCode”操作界面的“OK”按钮,会弹出如上图所示的“SequenceDataExplorer”操作界面。

如果点击“Cancel”按钮,也会弹出此操作界面,但是此时会把数据默认为非编码的DNA序列。

单击“SequenceDataExplorer”操作界面工具栏的“Data”按钮,有如下图所示的下拉菜单:

下拉菜单有六个选项:

“WriteDataToFile”(将数据转到文件中,利用此选项可以把Mega数据格式的数据转化成其它格式)、“Translate/Untranslate”(是否翻译,这个选项只有所分析的DNA序列是编码序列时才被激活)、“SelcetGeneticCodeTable”(选择遗传密码表,这个选项只有所分析的DNA序列是编码序列时才被激活)、“Setup/SelcetGenes&

Domains”(选择或设置基因或结构域)、“Setup/SelectTaxa&

Group”(对数据进行分组)、“QuitDataViewer”(退出此浏览框)。

单击“WriteDataToFile”选项,会弹出如下对话框:

Title框显示的内容是数据文件中“TITLE”之后的内容。

Description框显示的内容是数据文件中对整体数据描述的内容。

Format选项提供一个下来菜单,通过此下拉菜单可以把数据转化为MEGA格式、Nexus(PAUP4.0)格式,PHYLIP3.0格式、Nexus(PAUP3.0/MacClade)格式。

Writingsitenumbers选项也提供一个下拉菜单,通过此下来菜单可以把给每个核苷酸标序号,“None”为不显示序号,“Foreachsite”为每个位点显示序号,“Attheendofline”在每一行行末显示序号。

MissingDataandalignmentgaps选项也提供了一个下拉式菜单,这个菜单包括:

“Includesiteswithmiss/ambiguousdatagaps”(显示缺失位点及模糊位点以及空缺)、“Excludesiteswithmiss/ambiguousdatagaps”(不显示缺失位点及模糊位点以及空缺)、“Excludesiteswithmiss/ambiguousdataonly”(仅不显示缺失位点及模糊位点)、“Excludesiteswithalignmentgapsonly”(仅不显示比对是的空缺部分)。

如上述操作界面中的选项,点击“OK”按钮,会弹出如下界面:

此操作界面中的文字可以拷贝到文本文档中。

如果在“SquenceDataExplorer”操作界面的工具栏中选择“Highlight”中的“Variblesites”选项,则单击“WriteDataToFile”选项,会弹出如下对话框:

我们会发现与上述“ExportingSequenceData”操作界面相比,在最下方增加了一个“SelcetedsitestoInclude”下拉菜单框,此框包含:

Allsites(所有位点)、“Onlyhighlightedsites”(只显示相互之间有变异的位点)、“Onlyunhighlightedsites”(只显示相互之间无变异的位点)三个选项。

如上图中的操作界面中的选项,点击“OK”按钮,则会弹出如下对话框:

可以看出,在此操作界面中,仅显示了有变异的位点。

这样的数据形式在转化成“NetWork”遗传分析软件所需的数据格式时很方便。

单击“SequenceDataExplorer”操作界面的工具栏中“Data”中的“Setup/SelcetGenes&

Domains”选项,会弹出如下对话框:

通过此操作界面可以检测、确定、选择结构域,为某些位点添加标签等。

这个操作界面包括两大部分:

“Define/Edit/Select”和“SiteLabels”。

通过操作界面中“Genes/Domain”的子菜单“Data”可以设置,起始位点和末位点。

通过“CodonStart”选项,可以选择编码的起始位置。

在操作界面下端有一排按钮:

“AddGene”、“AddDomain”、“Delete/Edit”、“Expand”。

通过“AddGene”按钮可以添加或插入一个新的基因,通过“AddDomain”按钮可以添加或插入一个新的结构域,通过“Delete/Edit”按钮可以对数据进行编辑和删除,通过“Expand”可以展开数据,或仅显示第一水平的数据。

点击“SiteLabels”按钮,上述操作界面变为如下图所示:

点击上述操作界面中的“Close”按钮,返回“SequenceDataExplorer”操作界面。

选择工具栏“Data”下拉菜单中的“Setup/SelectTaxa&

Groups”选项,弹出如下图所示操作界面:

如上图操作界面,点击“NewGroup”按钮可以创建一个新的组,点击“DeleteGroup”按钮可以删除一个已经存在的组,在操作界面的中间竖排有五个按钮,同最上端两个按钮可以把数据移入或移出一个选定的组,点击第三个按钮可以对选定的组进行重新命名,点击“+”按钮可以创建一个新的组,点击“—”按钮可以删除一个已经存在的组。

注意,组的名字不能与任何一个样本重名。

点击“Close”按钮,“SequenceDataExplorer”操作界面。

点击此操作界面中的“Display”按钮,会弹出如下操作菜单:

从上述操作界面图看,下拉菜单共有:

“ShowOnlySelectedSequences”(仅显示选中的序列)、“UseIdenticalSymbol”(利用同一标记符号)、“ColorCells”(色彩单元)、“SortSequences”(序列分类)、“RestoreInputOrder”(恢复输入序列的顺序)、“ShowSequenceNames”(显示序列名字)、“ShowGroupNames”(显示序列所在的组的名字)和“ChangeFont”(改变字体)八个选项。

选择“ShowOnlySelectedSequences”选项,只有被选中的序列才会在界面中显示,不过软件默认的是所有输入的序列都是被选中的,不过软件使用者是可以修改哪些序列被选中。

选择“UseIdenticalSymbol”选项,那么与第一个序列相同的核苷酸将用“.”显示,与之相比,发生变异的核苷酸才以“A、T、C、G”的形式显示。

选择“ColorCells”选项,不同的核苷酸将用不同的颜色显示,如下图所示。

“SortSequences”选项有四个子选项:

“BySequenceName”(通过序列名字排列)、“ByGroupName”(通过组的名字排列)、“ByGroup&

SequenceName”(通过组和序列的名字排列)、“AsperTaxa&

GroupOrganizer”()。

选择“RestoreInputOrder”选项,则序列排列顺序恢复到与输入数据文件中的顺序一样。

选择“ShowSequenceNames”选项,则每个序列的名字被显示。

选择“ShowGroupNames”,则每个序列所在的组的名字将被显示。

选择“ChangeFont”选项,可以改变序列名字、组名及其序列本身的字体大小及颜色,默认的字体大小是“小五”,默认的字体颜色是黑色,默认的字型是常规,无下划线、删除线。

点击“SequenceDataExplorer”操作界面的“Highlight”选项,会有如下图所示的下拉菜单选项:

由上图可以看出,“Highlight”的下拉菜单共有七个选项:

“ConservedSites”(C,保守位点)、“Variablesites”(V,变异位点)、“Parsim-Infosites”(P,简约信息位点)、“Singletonsites”(S,单独位点)、“0-foldDegeneratesites”(0,未简并位点)、“2-foldDegeneratesites”(2,2倍简并位点)、“4-foldDegeneratesites”(4,4倍简并位点);

其中后三个选项,只有在输入的序列是编码序码时才被激活。

选择“ConservedSites”选项,所有的保守位点,即没有发生变异的位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

选择“Variablesites”选项,所有的变异位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

选择“Parsim-Infosites”选项,所有简约变异位点(即变异至少包括两种类型的核苷酸或氨基酸)将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

选择“Singletonsites”选项,单突变(变异至少包括两种类型的核苷酸或氨基酸,而且在所有样本中仅发生一次)的位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

选择“0-foldDegeneratesites”选项,那些所有突变都是非同义突变的位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

此选项只有在输入数据中含有编码蛋白的DNA序列时才被激活。

选择“2-foldDegeneratesites”选项,那些在所有突变中同义突变占1/3的位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

选择“4-foldDegeneratesites”选项,那些所有突变全部是同义突变的位点,将被突出显示,位点的总数目将在状态栏(操作界面最下端)显示。

点击“SequenceDataExplorer”操作界面的“Statistics”选项,会有如下图所示的下拉菜单选项:

从上图可以看出,此下拉菜单总共有六个选项:

“NucleotideComposition”(核苷酸组成)、“NucleotidePairFrequence”(核苷酸配对频率)、“CodonUsage”(密码子使用)、“AminoAcidComposition”(氨基酸组成)、“UseAllSelectedSites”(利用所有选择的位点)、“UseOnlyHighlightedSites”(仅利用突出显示的位点)。

选择“NucleotideComposition”选项,可以计算得到,每条序列中A、T、C、G及U的百分含量,以及总的核苷酸个数,还可以得到整个数据中A、T、C、G及U的百分含量。

如果数据是编码蛋白质的DNA序列,那么还可以得到每种核苷酸在密码子各个位置的比例。

选择“NucleotidePairFrequence”选项,可以计算DNA序列中核苷酸配对的频率。

这个选项有两个子菜单:

“Directional(16Pairs)”和“Undirectional(10Pairs)”。

一个是有方向性的,一个是没有的。

选择“CodonUsage”选项,能够统计出每种密码子的使用频率。

选择“AminoAcidComposition”选项,能够统计出每条序列中各种氨基酸的组成百分含量,以及总的氨基酸个数。

还可以计算出整个数据中每种氨基酸的组成百分含量。

此选项只有在输入数据是氨基酸的条件下才被激活。

选择“UseAllSelectedSites”选项,在计算统计时,可以利用所有被选中的位点。

选择“UseOnlyHighlightedSites”选项,在计算分析时,仅利用那些被突出显示的位点进行计算。

在菜单栏的下方是一些常用的快捷方式,如下图示:

上图图标中,所对应的操作从左到右依次是:

“WriteDataToFile”(将数据转到文件中)、“Setup/SelectTaxa&

Group”(对数据进行分组)、“Setup/SelcetGenes&

Domains”(选择或设置基因或结构域)、“UseIdenticalSymbol”(利用同一标记符号)、“Color”(进行色彩设置)、“ConservedSites”(C,保守位点)、“Variablesites”(V,变异位点)、“Parsim-Infosites”(P,简约信息位点)、“Singletonsites”(S,单独位点)、“0-foldDegeneratesites”(0,未简并位点)、“2-foldDegeneratesites”(2,2倍简并位点)、“4-foldDegeneratesites”(4,4倍简并位点)、将核苷酸序列翻译为蛋白质序列。

点击“SequenceDataExplorer”界面的“Data”下拉菜单中的“QuitDataViewer”选项,即可关闭此操作界面,返回到Mega操作的主界面。

2、遗传距离的计算

2.1遗传距离模型的选择

点击Mega操作主界面的“Distances”按钮,会弹出一个下拉菜单。

从上图易知,此菜单包括如下选项:

“ChooseModel”(选择模型,即选择计算遗传距离的模型)、“ComputePairwise”(计算遗传配对差异)、“ComputeOverallMean”(计算包括所有样本在内的平均遗传距离)、“ComputeWithGroupMeans”(计算组内平均遗传距离)、“ComputeBetweenGroupsMeans”(计算组间平均遗传距离)、“ComputeNetBetweenGroupsMeans”(计算组间平均净遗传距离)、“ComputeSequenceDiversity”(计算序列分歧度)。

“ComputeSequenceDiversity”选项包括四个子菜单:

“MeanDiversityWithinSubpopulations”(亚群体内部平均序列多态性)、“MeanDiversityforEntirePopulation”(整个人群平均序列多态性)、“MeanInterpopulaionalDiversity”(群体内部平均序列多态性)、“CoefficientofDifferentiation”(遗传变异系数)。

点击“ChooseModel”选项,会弹出如下操作界面:

从上述操作界面可以看出,通过此对话框可以选择计算遗传距离的模型等。

“DataType”显示数据的类型:

Nucleotide(Coding)(编码蛋白质的DNA序列)、Nucleotide(不编码蛋白质的DNA序列)、AminoAcid(氨基酸序列)。

通过“Model”选项可以选择,计算遗传距离的距离模型。

点击“Model”一行末端的按钮会弹出一选择栏。

如上图所示,对于非编码的核苷酸序列Mega程序提供了八种距离模型:

“NumberofDifference”(核苷酸差异数)、“P-distance”(P距离模型)、“Jukes-Cantor”(Jukes和Cantor距离模型)、“Kimura2-Parameter”(Kimura双参数模型)、“Tajima-Nei”(Tajima和Nei距离模型)、“Tamura3-parameter”(Tamura三参数模型)、“Tamura-Nei”(Tamura和Nei距离模型)、“LogDet(Tamurakumar)”(对数行列式距离模型)。

对于编码的核苷酸序列,其遗传距离模型如下图所示:

如上图所示,对于编码蛋白质的DNA序列,Mega程序提供了一下几种模型:

“Nei-GojoboriMethod”,“ModifiedNei-GojoboriMethoed”、“Li-Wu-LuoMethod”、“Pamilo-Bianchi-LiMethod”、“KumarMethod”。

其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型:

“NumberofDifferences”、“P-distance”、“Jukes-Cantor”。

对于氨基酸序列,Mega所提供的遗传距离模型如下图所示:

如上图所示,对于氨基酸序列,Mega程序提供了一下六种遗传距离模型:

“NumberofDifferences”(氨基酸差异数)、“P-distance”(P距离模型)、“PoissonCorrection”(泊松校正距离模型)、“EqualInput”(等量输入距离模型)、“PAMMatrix(Dayhoff)”(PAM距离矩阵模型)、“JTTMatrix(Jones-Taylor-Thornton)”(JTT距离矩阵模型)。

在“AnalysisPreference”操作界面中,“PatternAmongLineages”仅提供了一个选项:

“Same(Homogenous)”“,也就是说样本之间是有一定同源性的。

“Ratesamongsites”提供了两个选项:

“UniformRates”和“Different(GammaDistributed)”。

“UniformRates”意味着所有序列的所有位点的进化速率是相同的。

选择“Different(GammaDistributed)”,意味着序列位点之间的进化速率是不相同的,可以利用Gamma参数来校正,系统提供了四个数值可供选择:

2.0、1.0、0.5、0.25;

软件使用者也可以自行决定Gamma参数的大小。

设置完毕后,在此界面中点击“OK”按钮,即可返回Mega操作主界面。

选择主操作界面“Distance”中的“ComputePairwise”选项,可以计算样本之间的遗传距离的大小,其操作界面如下图所示:

从上述操作界面易知:

“DataType”显示数据的类型,图中为“Nucleotide”。

“Analysis”显示计算分分析的类型,图中为“PairwiseDistanceCalculation”(配对差异距离计算)。

“Compute”显示所要运行的对象,又两个选项:

“Distanceonly”(仅计算遗传距离)和“Distance&

Std.Err”(计算遗传距离和其标准误)。

“IncludeSites”显示利用哪些位点来计算,如果数据类型是不编码蛋白质的核苷酸序列,则全部参与计算,如果是编码蛋白质的核苷酸序列,则可以选择哪些位点(如密码子的第2位等)来参与运算。

“SubstitutionModel”是替代的模型,在下边“Model”中可以进行选择。

“SubstitutionstoInclued”选择哪些替代类型(如下图所示)被用于运算,d选项将转换和颠换全部包括在内,s选项仅包括转换,v选项仅包括颠换,R为转换和颠换的比值,L为所有有效的普通位点的个数。

“PatternamongLineages”和“Ratesamongsites”上文已有介绍,不再详述。

点击“Compute”按钮,即可开始计算。

其显示运算结果的界面如下图所示:

上图是计算出的各个样本之间的遗传距离的矩阵。

在最下端的状态栏,显示的是所利用的遗传距离模型,如图中所示:

Nucleotide:

Kimura2-parameter。

“File”按钮共

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2