Phylip中文使用说明Word格式文档下载.doc
《Phylip中文使用说明Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《Phylip中文使用说明Word格式文档下载.doc(13页珍藏版)》请在冰点文库上搜索。
程序
重抽样工具
该程序生成一系列的特殊的随机样本,保存在outfile中。
这些样本在后继的分析中作为一个序列对文件,要设置选项M(usemultipledatasets)。
Seqboot
生成随机样本,用bootstrap和jack-knife方法。
距离方法:
顺序使用这些程序。
首先,用dandist或protdist程序计算序列比对结果的距离矩阵。
接着这个矩阵被fitch、kitsch或neighbor程序转换为树。
Dandist和protdist程序的输出文件是outfile。
在运行fitch、kitsch或neighbor前,outfile应该重命名为infile或另外的名字。
fitch、kitsch和neighbor的输出文件是outfile和outtree。
Dnadist
DNA距离矩阵计算器
Protdist
蛋白质距离矩阵计算器
Fitch
没有分子时钟的Fitch-Margoliash树
Kitsch
有分子时钟的Fitch-Margoliash树
Neighbor
Neighbor-Joining和UPGMA树
基于字符的方法
这些程序读入一个序列对,它们的输出文件是outfile和outtree。
Dnapars
DNA简约法
Dnapenny
DNA简约法usingbranch-and-bound
Dnaml
DNA最大似然,无分子时钟
Dnamlk
DNA最大似然,有分子时钟
Protpars
蛋白质简约法
Proml
蛋白质最大似然法
画树
这些程序可画newick格式的树。
如,danml程序生成的树。
Drawgram和drawtree生成文件为plotfile,而retree生成outtree。
Drawgram
画有根树
Drawtree
画无根树
Retree
interactivetree-rearrangement
一致树
用多重树构建一致树。
如,dnapars可生成多重树,可用consense程序来汇总。
Bootstrap的结果也由它来汇总为一棵majorityruletree。
Consense
drawsconsensustreesfrommultipletrees
树的距离
计算多个树间的基于拓朴结构的距离。
该方法可用来比较不同分析方法的结果。
Treedist
计算树拓朴结构间的距离
Example距离法
一.获取序列
一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。
用BIOEDIT等软件编辑序列名称,注意PHYLIP在DOS下运行,文件名不能超过10位,超过的会自动截留前面10位。
二、多序列比对
目前一般应用CLASTALX进行,注意输出格式选用PHY格式。
生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,但是注意不是真正的进化树。
在clusterx中,生成的phylip文件的序列名称被截断成10字符,所以命名时注意要让树中出现什么名字。
三、构建进化树
N-J法建树
依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。
具体步骤如下:
(1)打开seqboot.exe
Seqboot首先检查该程序所在文件夹中是否有infile文件。
如果没有找到infile,它就会提示你输入序列比对文件。
输入文件名:
输入你用CLASTALX生成的PHY文件(*.phy)。
J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute。
在此选择BootStrap
R为bootstrap的次数,R选项让使用者输入重复的replicate数目。
所谓replicate就是用Bootstrap法生成的一个多序列组。
根据多序列中所含的序列的数目的不同可以选取不同的,常用100或者1000。
(设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为100或者1000)
当我们设置好条件后,键入Y按回车。
得到一个文件outfile,这个文件包括了1000个replicate。
输入Randomnumberseedoddnumber:
(4N+1)(eg:
1、5、9…)
改好了y
得到outfile(在phylip文件夹内)
改名为seqbootoutfile
(2)打开Dnadist.EXE
输入seqbootoutfile
得到dnadist的菜单
NucleicacidsequenceDistanceMatrixprogram,version3.66
Settingsforthisrun:
DDistance(F84,Kimura,Jukes-Cantor,LogDet)?
F84
GGammadistributedratesacrosssites?
No
TTransition/transversionratio?
2.0
COnecategoryofsubstitutionrates?
Yes
WUseweightsforsites?
FUseempiricalbasefrequencies?
LFormofdistancematrix?
Square
MAnalyzemultipledatasets?
IInputsequencesinterleaved?
0Terminaltype(IBMPC,ANSI,none)?
ANSI
1PrintoutthedataatstartofrunNo
2PrintindicationsofprogressofrunYes
Ytoaccepttheseortypetheletterforonetochange
输入d按回车将循环得到不同的进化模式(一般不选)
输入m修改M值,再按D,然后输入1000(M值对应前面BootStrap中的重复数值)
y
改名为dnadistoutfile
(3)打开Neighboor.EXE
输入dnadistoutfile
菜单
Neighbor-Joining/UPGMAmethodversion3.66
NNeighbor-joiningorUPGMAtree?
Neighbor-joining
OOutgrouproot?
No,useasoutgroupspecies1
LLower-triangulardatamatrix?
RUpper-triangulardatamatrix?
SSubreplicates?
JRandomizeinputorderofspecies?
No.Useinputorder
3PrintouttreeYes
4Writeouttreesontotreefile?
选项J,设置随即分布
选项O是让使用者设定一个序列作为outgroup,这个不选,在后期用treeview或者mega打开再选择。
输入m,修改M=1000(M值)
按Y
得到outfile和outtree(在phylip文件夹内)
改outtree为neighborouttree,outfile改为neighboroutfile
(4)打开consense.exe
输入neighborouttree
Outfile可以改为*.txt文件,用记事本打开阅读。
outtree可改为njouttree
想用treeview看到树图的bootstrap值必须用consense做出的outtree
(5)打开drawgram.exe(有根)或者drawtree.exe(无根)(这一步也可以不做)
该程序首先寻找文件fontfile,如果找不到它(如果你没有把字体文件之一改为fontfile的话),它会提示输入一个字体文件。
输入font1。
P选择图像输出格式
W对应的最终画图设备改为MS-windowsbitmap。
它还要要求你输入树的维数,比如说2000*2000。
Y按回车。
Drawgram打开一个新的窗口,你可以看到一棵树,如果你满意这个结果,选择file菜单中的plot。
在当前文件夹中出现一个plotfile文件。
如果你将它重命名为plotfile.bmp,就可用图形工具将它打开了。
四、进化树编辑和阅读
outtree可改为*.tre文件,直接双击在treeview里看;
也可以不改文件扩展名,直接用treeview、PHYLODRAW、NJPLOT等软件打开编辑。
TREEVIEW可以显示BOOTSTRAN值,序列较多(60条以上)的时候打开直接显示有明显的重叠,可以在打印预览中显示,或输出为EMFWMF图片文件看,但是序列较多时BOOTSTRAN值的显示位置比较乱,和序列名称有重叠。
PHYLODRAW的编辑功能较强,可以自由调节X、Y轴的长度。
输出格式为BMP、PS格式。
缺点是不能直接显示BOOTSTRAN值,包括打开TREEVIEW输出的NEX文件,而且输出的BMP文件不全,类似截屏文件,可以用PHOTOSHOP进行拼接合成,添加BOOTSTRAN值和注解符号等。
据说也可以将PS文件用记事本打开,改变其中的字号,然后通过ADOBE DISTRILLOR将PS转化为PDF,就可以解决问题。
如果发现还有重叠,可以再次改变PS文件中的字号大小,直到合适为止。
NJPLOT可以显示BOOTSTRAN值和分值长度。
但是不能调节图片X、Y轴的长度。
也可以用CLASTALX中的BOOTSTRANN-JTREE法生成进化树,TREE菜单输出格式选项(OUTPUTFORMATOPTION)中的BOOTSTRANLABELSON选NODE(节点)。
在treeview里,选择tree菜单,然后把showinternaledgelables的选项打勾了,直接打开生成的文件bootstrap的值就可以显示出来
建MP,ML树将Dnadist和Neighboot两步分修别改为Dnapars和Dnaml,两步变作一步,其余步骤相同。
蛋白质距离法构建N-J树
蛋白质构建树软件使用步骤
DNA构建树软件使用步骤