Mothur命令手册范本.docx

资源描述

Mothur命令手册范本.docx

《Mothur命令手册范本.docx》由会员分享，可在线阅读，更多相关《Mothur命令手册范本.docx（12页珍藏版）》请在冰点文库上搜索。

Mothur命令手册范本.docx

Mothur命令手册范本

Mothur命令手册-Mothur命令中文解释

（一）

Mothur命令教程

从这个页面.mothur.org/wiki/Category:

Commands

上查阅的所有命令，根据个人理解翻译了一下。

个人能力有限，会有不当之处。

A-G（查看时请用Ctrl+F快捷键）

Align.check

这个命令使你计算16SrRNA基因序列中潜在的错配碱基对数目。

如果你对ARB（.arb-home.de/）的编辑窗口熟悉的话，这与计算~，#，-和=这些符号的数目相同。

用greengenes的二级结构图谱和esophagusdataset运行这个命令。

要运行这个命令，你必须提供FASTA格式的序列文件。

Align.seqs

这个命令把用户提供的FASTA格式的候选序列文件对齐到用户提供的同样格式的模板序列。

通用的方法是：

1.采用kmersearching（treesearching找到每个候选序列的最接近模板

2.在候选序列文件和空位模板序列之间进行碱基配对，采用Needleman-Wunsch，Gotoh，或者blastn算法规则。

3.重新在候选和模板序列对之间插入间隔（空位），采用NAST算法，这样候选序列就能与原始模板序列兼容。

我们提供了一些16S和18S基因序列的数据库，这些是与greengenes和SILVA队列兼容的。

然而，自定义的任何DNA序列的排列都可以用作模板，所以鼓励用户分享他们的排列供其他人使用。

普遍来说，进行排列是很快的-我们能在3小时将超过186000个的全长序列排序到SILVA排列中，而且质量像SINAaligner做的一样好。

另外，这个速率可以由多个处理器加倍。

Amova

分子方差分析（Analysisofmolecularvariance）是一种传统方差分析的非参数模拟。

这种方法被广泛应用在种群遗传学以检测关于两个种群的遗传多样性不是显著不同于由这两个种群的共同联合导致的多样性这样一个假设。

Anosim

参考文献：

Clarke,K.R.（1993）.Non-parametricmultivariateanalysisofchangesincommunitystructure._AustralianJournalofEcology_18,117-143.群落结构变化的非参数多元分析《澳大利亚生态学报》

Bin.seqs

这个命令输出一个fasta格式的文件，其中序列根据它们所属的OTU进行排序。

这样的输出也许对一个OTU生成特异性引物有帮助，用来对序列进行分类。

Catchall

这个命令使mothur与LindaWoodard，SeanConnolly和JohnBunge开发的catchall程序连接。

获取更多信息，请参看.northeastern.edu/catchall/index.html。

catchall的可执行程序必须与你的mothur在同一个文件夹里。

如果你是一个Mac或Linux用户，你必须也安装了mono，在catchall的网页中有一个关于mono的。

Chimera.bellerophon

采用Bellerophon方法生成一个挑选的优先嵌合序列的得分列表。

Chimera.ccode

采用Ccode方法。

对每个词语，在查询序列和参考序列之间对比距离的差异，以及参考序列与它们自己。

Chimera.check

采用chimeraCheck方法...注意：

从RDP模型中，这个方法不能决定一个序列是否是嵌合的，但是让你决定那些基于产生的IS值的序列。

查看查询的序列的左边到它的最近的匹配的距离+查询的右边到它最近的匹配的距离-整个查询序列到它最近的匹配的距离，通过多个窗口

Chimera.perseus

这个命令读取并命名一个fasta文件，输出潜在的嵌合序列。

Chimera.pintail

采用Pintall方法。

在不同的窗口中查询一个序列，查看期望的差异与观察到的差异之间的不同

Chimera.seqs

这个命令已经被拆分为6个分离的命令。

目前，mothur执行六种方法以确定一个序列是不是嵌合的。

如果有一个你喜欢看到的算法可以实施，请考虑一下或者贡献给mothur项目，或者联系开发者，我们将会考虑我们能做什么。

chimera.bellerophon

chimera.pintail

chimera.check

chimera.ccode

chimera.slayer

chimera.uchime

Chimera.slayer

这个命令读取一个fasta文件和参照文件，并输出潜在的嵌合序列。

原始算法的开发者建议采用一个特殊的模版参照（例如，gold）。

我们用silva参照文件提供silva-based排列的数据库。

你将需要在blast/bin文件夹中有megablast和formatdb可执行文件的拷贝，这里blast文件夹与mothur可执行程序相邻。

megablast/formatdb的版本可以在这里

ftp:

//ftp.ncbi.nlm.nih.gov/blast/executables/release/2.2.25/找到，或者它们就包含在mothur的程序版本中。

Chimera.uchime

这个命令读取一个fasta文件和参考文件，并输出潜在的嵌合序列。

原始的uchime程序是由RobertC.Edgar编写的，并且贡献为公共所有。

drive5./uchime/

Chop.seqs

这个命令读取一个fasta文件，输出一个.chop.fasta，包含着修剪的整理的序列。

它可以用于排序的和未排序的序列。

Classify.otu

这个命令用来为一个OTU得到一个共有序列分类.

Classify.seqs

这个命令允许用户使用多个不同的方法把他们的序列分配到他们选择的分类提纲（轮廓）中。

当前的方法包括采用一个k-nearest邻近共有序列和Bayesian方法。

分类提纲和参考序列可以在taxonomyoutline（.mothur.org/wiki/Taxonomy_outline）的页面中获得。

这个命令需要你提供一个fasta格式的输入文件和数据库序列文件，还要有一个为了参考序列的分类文件。

Classify.tree

这个命令用来为一个进化树的每个节点获得一个共有序列。

Clear.memory

这个命令从存中删除保存的参考数据，你可以在已经用以下命令（align.seqs,chimera.ccode,chimera.check,chimera.pintail,chimera.slayer和classify.seqs）之一使用过保存参数之后使用chear.memory.

Clearcut

这个让mothur用户在mothur部运行clearcut程序。

chearcut程序是由Idaho大学的InitiativeforBioinformatics和EvolutionaryStudies（IBEST）编写。

了解更多clearcut相关信息，参看bioinformatics.hungry./clearcut/。

注意，在版本1.13.0中，clearcut源码已经加进mothur，所以你不再需要clearcut的可执行程序。

当然，如果你愿意，你仍可以从这里下载clearcut的可执行文件.mothur.org/wiki/Download_Clearcut

Cluster

一旦一个距离矩阵读进mothur，cluster命令就能用来给OTUs分派序列。

目前，mothur采用三个分簇方式。

最近邻：

从OTU的最相似序列，一个OTU的每一个序列都最多x%的距离

最远邻：

一个OTU的所有序列与OTU的所有其它序列最多有X%的距离

平均邻近：

这个方法介于另外两个算法的中间水平

如果您有一个算法，请考虑一下贡献给mothur项目。

Cluster.classic

这个命令可用于把序列分配到OTUs.它是cluster的dotur工具，目前mothur采用三个分簇方式。

Cluster.fragments

这个命令需要一个fasta格式的文件，也要提供

一个命名的文件而且当一个序列被确定为一个更大的序列的一部分时，列出的与序列名相关的指明文件就会被合并。

Cluster.split

这个命令用来分配序列到OTUs并输出一个.list,.rabund,.sabund文件.它把大的距离矩阵拆分为小的部分。

Collect.shared

这个命令给计算器生成一个收集曲线，描绘出不同群落间的相似性或它们的共有丰度。

Collector'scurves描绘随着你样本增加的个体，丰富度和多样性的变化。

如果Collector'scurves变得与x轴平行，你可以合理的确信你在采样这个工作上做的很好，并且相信曲线上的最终值。

否则，你需要继续抽样（采样），mothur能为collector'scurves生成数据，就像sons做的那样。

当时sons将数据呈现在sons文件中，实际上不可能被新手分析解读。

mothur解决了许多这样的问题，因为mothur为每一个估计值产生分离的文件。

Collect.single

Collect.single利用计算器（.mothur.org/wiki/Calculators）生成collector'scurves，描述了丰度，多样性和样本的其他特征。

Collector'scurves描绘了你抽取额外的个体时丰度和多样性的变化。

Consensus.seqs

这个命令可以以两种方式使用：

从fasta文件创建一个共有序列，或者由一个list文件为每个OTU创建一个共有序列。

序列必须进行排列。

Consensus.seqs的参数（特征，因素）是fasta,list,name和label

Cooccurrence

这个命令计算四个度量并且测试他们的显著性以评估是否样式的存在与否比起那些随机期待的有所不同。

Corr.axes

这个命令将会计算在shared/relabund文件中每一行（或列）的相关系数，记录在一个pcoa文件所显示的轴线上。

Count.groups

这个命令从一个特定的组（group）或者一套组算出序列，从下面这些文件类型：

group或者shared文件.

Count.seqs

这个命令计算在一个name文件中的代表性序列所代表的序列的数目。

如果提供了一个group文件，它也会提供使group计数崩溃。

Create.database

这个命令读取一个list文件，*.cons.taxonomy,*.rep.fasta,*.rep.names和可选的group文件，并且创建一个数据库（database）文件.

Degap.seqs

这个命令读取一个fasta文件并输出一个.ng.fasta文件，它包含所有间隔字符都被移除后的序列。

Deunique.seqs

这个命令是unique.seqs的反向命令，从一个fasta和name文件创建一个fasta文件。

Deunique.tree

这个命令把冗余序列标识符重新插入一个唯一的系统树。

Dist.seqs

这个命令将计算两个排序的DNA序列间不正确的成对距离。

这个方法比通用的DNADIST更好，因为这些距离不是存储在RAM（随机存储器）中，它们直接打印到一个文件。

而且，通过它可以忽略可能不感兴趣的大的距离。

这个命令将产生一个列格式的距离矩阵，这个矩阵与read.dist命令中的列选项相互兼容。

这个命令也能生成一个phylip格式的距离矩阵。

它有多个如何操纵gap比较和末端gap的选项。

Dist.shared

这个命令将会生成一个phylip格式的距离矩阵，描述多个组的差异性。

这个命令将会计算任何一个描述群落成员或结构相似性的计算子（calculator）。

Fastq.info

这个命令读取一个fastq文件，并创建一个fasta和quality文件。

Filter.seqs

filter.seqs从基于一个由用户定义标准的排列删除列。

例如，生成的与参照排列相对的排列经常有一些列的每一个字符是.或者-。

这些列不会包含用于计算距离，因为他们本身没有信息。

通过删除这些列，计算大量的距离这一过程就会加快。

同样，人们也喜欢用温和的或强制的屏蔽方式（比如Lane'mask）屏蔽他们的序列来移除可变区域。

这类屏蔽只在深层次系统进化分析时鼓励使用，而在精细水平的分析比如需要计算OTUs中不建议。

Get.coremicrobiome

这个命令决定可变数目的样本中的OTUs的片段，为了不同的最小相关丰富度。

Get.current

这个命令允许你找出mothur已经为每个类型保存为current的一些文件，你也可以清空current文件。

Get.group

这个命令允许你为储存在存中的多个样本的OTU数据获得一个已有的不同群组的目录。

这个特征应该在为其它命令使用group选项时有帮助。

Get.groups

这个命令从一个特定group或一套groups选择序列。

group来自以下文件类型：

fasta，name，group，list，taxonomy.

Get.label

这个命令是你为当前储存在存中的每行OTU数据获得一个标签的目录。

这个特征应该在为其他命令使用label选项时有帮助。

Get.lineage

这个命令读取一个taxonomy文件和一个分类（taxon），并产生一个新的文件只包含有来自分类的序列。

你也许也会把一个fasta,name,group,list或者align.report文件包括到这个命令中，mothur将会为那些只包含有选定序列的文件生成新的文件。

Get.otulist

这个命令解析一个list文件并且为每一个包含两列的距离创建一个.otu文件。

第一列是OTU数目，第二列是那个OTU中的序列的列表（list）。

Get.oturep

bin.seqs命令能为所有序列报告OTU（即编号），get.oturep命令生成一个fasta格式的序列文件，为每个OTU只包含一个代表性序列。

为每个OTU的定义生成一个.rep.fasta和.rep.names文件。

Get.otus

这个命令选择出包含有来自一个特定group或一副groups的序列的OTUs.

Get.rabund

这个命令将生成一个rabund文件，它基于你输入到mothur的OTU数据。

Get.relabund

这个命令计算一个样本中的每个OTU的相对丰富度。

它将输出一个.relabund文件。

Get.sabund

这个命令将产生一个sabund文件，基于你读入mothur的OTU数据。

例如，如果你读入一个list文件，get.sabund将产生对应的sabund文件。

Get.seqs

这个命令把一个序列名字的列表（list）和一个fasta，name，group，list或align.report文件生成一个新的文件，只包含在list中出现的文件。

这个命令也许用于和list.seqs命令结合以帮助显示一个序列结合。

Get.sharedseqs

这个命令取一个list和group文件并为每个距离输出一个*.shared.seqs文件。

这对于那些情况有用，即你或许对于确定特殊groups中特定的或共有的序列感兴趣。

这样接下来你就可以分类

Mothur命令中文解释——Mothur中文简易教程

这些是mothurH-Z的目前所有命令的说明的翻译，第二部分。

（使用Ctrl+F搜索你所查命令）

参看.mothur.org/wiki/Category:

Commands页面上查阅的所有命令

我查了一下网上的中文教程，似乎没有。

现在国使用Mothur的人还很少，不过国外有不少做生态的都用到mothur了。

毕竟有很多都是命令行操作。

前天我还搜到了一个印度人在网上发的询问帖子，想问哪里有关于mothur的简单教程呢，他说mothur官方的教程有点难，看不太懂。

今天这些命令里有三个可能会比较常用，一个是help，就类似于Linux中的man命令，也就是你在windows中常见的帮助文件。

还有两个，sffinfo和pipeline.pds，在处理sff文件时会用上。

其中sffinfo就能将sff文件转化为fasta格式的文件，fasta是mothur处理的文件中最常见的格式。

由于最近我要处理一个sff文件，所以特别关注了与sff有关的命令，呵呵。

Hcluster

这个命令可以用来给OTUs分配序列，并输出一个.list,.rabund,.sabund和.sorted.dist文件。

它不会像cluster命令那样把距离矩阵（distancematrix）保存在RAM（随机存储器）中，允许大距离文件被处理。

Hcluster对小文件的处理比cluster要慢，但在大文件上更有竞争力。

目前，hcluster实行4种成簇方式：

1.最近相邻：

一个OTU的每个序列与OTU中最相似的序列有最多X%的距离。

2.最远相邻：

一个OTU的所有序列与OTU的其它序列有最多X%的距离。

3.平均相邻：

这个方法介于其他两种方法之间的水平

4.重量相邻：

Heatmap.bin

这个命令从一个*.list或*.shared文件提供的数据生成一个heatmap。

heatmap中的每一行呈现一个不同的OTU，每个组中的OTU的颜色根据那个组那个OTU的丰富度在黑与红之间形成成比例。

这个命令会生成一个SVG文件（图片格式），它可以在GIMP或AdobeIllustrator中被进一步修改。

有一些选项用于为每个采取不同方法的OTU相对丰度按比例绘制或排列。

Heatmap.sim

这个命令将会产生一个表明多个样本之间成对相似性的heatmap，采用了多个对比群落成员和结构的calculators（.mothur.org/wiki/Calculators）

Help

help命令将会输出mothur中有效命令的表单。

或者，如果你想要针对一个特定命令的帮助信息，用help作为选项，比如mothur>read.list（help），就会输出read.list的帮助信息。

Homova

分子方差的同质性（Homogeneityofmolecularvariance）是一个为方差同质的Bartlett'stest的非参数模拟，这已经被用于种群遗传学，检测以下假设：

两个或多个种群的基因多样性是同类的或同质的（StewartandExcoffier，1996）;这个测试还没有用于微生物生态学文献。

Indicator

这个命令可以三种方式运行：

1.用一个shared或relabund文件和一个design文件

2.用一个shared或relabund文件和一个tree文件

3.用一个shared或relabund，tree文件和design文件

Indicator命令输出一个.indicator.summary文件和一个.indicator.tre文件，如果给了一个tree。

新的tree在每个部的节点包含了标签。

标签是节点，所以你可以把tree关联到summary文件。

Summary文件为每个OTU的每个节点列出了indicator的值。

Libshuff

这个命令像以前在s-libshuff和libshuff程序中那样实施libshuff方法。

libshuff法是一个描述两个或更多群落是否拥有相同结构的通用测试，采用Cramer-vonMises检测统计。

这个检测统计值的显著性表明了群落（偶然）拥有同样结构的可能性。

因为每个成对的对比需要两个显著测试，所以为多个对比进行一个矫正（比如Bonferroni'scorrection）。

List.seqs

这个命令将会写出在一个fasta，name，group，list或align.report文件中发现的序列名字。

这对于使用get.seqs，remove.seqs命令和生成group文件时有用。

Make.biom

make.biom命令让你把你的shared文件转换为一个biom文件。

关于biom格式：

biom-format.org/documentation/biom_format.html

Make.fastq

这个命令读取一个fasta和一个quality文件并创建一个fastq文件。

Make.group

这个命令读取一个fasta文件或一系列fasta文件，并创建一个group文件。

Make.shared

这个命令读取一个list和group或biom文件，并为每个group创建一个.shared和一个rabund文件。

Mantel

Mantel命令计算两个矩阵的mantel相关系数。

Sokal,R.R.,&Rohlf,F.J.（1995）.Biometry,3rdedn.NewYork:

Freeman.

Merge.files

这个命令将把多个文件连结（使连续）起来并把结果输出到一个新文件。

这对于合并多个fasta格式的序列文件，454quality文件，group文件，name文件或其它等等是有用的。

Merge.groups

这个命令读取一个shared文件和一个design文件并把shared文件中同样也在design文件中分组的groups合并。

Metastats

这个命令基于White.J.R.，Nagarajan.N.和Pop.M.开发的Metastats程序。

统计方法用来检测客观因组样本的差异丰度特征。

Mgcluster

该命令解释暂无，需要blast参数，官方有使用方法。

.mothur.org/wiki/Mgcluster

Nmds

这个命令是SarahGoslee在R（.r-project.org/）中所写nmds代码的模型化。

采用非矩阵多维尺度分析功能，使用的Borg&Groenen的优化算法。

Normalize.shared

这个命令创建一个.norm.shared文件。

Otu.association

这个命令计算一个shared/relabund文件中的OTUs的相关系数。

Otu.hierarchy

这个命令把不同距离上的OTUs关联起来。

Pairwise.seqs

这个命令将计算序列之间不正确的成对距离。

这会生成一个列格式的距离矩阵，与read.dist中的列选项兼容。

这个命令也能产生一个phylip格式的距离矩阵，关于如何操作gap对比和末端gaps有多个选项。

Parse.list

这个命令读取一个list文件和group文件，并为group文件中的每个group生成一个list。

Parsimony

这个命令采用parsimony方法（akaP-test），以前在TreeClimber中使用过，现在在MacClade和UniFac中也有。

这个Parsimony方法是一个通用的检测，用来描述两个或更多群落是否拥有同样的结构。

检测统计值的显著性只表明群落随机具有相同结构的可能性。

这个值不表明相似度水平。

Pca

运行这个命令需要一个shared或relabund文件。

Pcoa

需要一个plylip格式的距离矩阵文件。

pcr.seqs

这个命令将根据用户自定义的

展开阅读全文