phylip软件使用
PHYLIP是一个综合的系统发生分析软件包,由华盛顿大学的Joseph Felsenstein开发的。现在该软件包可完成许多系统发生分析。软件包中可用的方法包括了简约法、距离矩阵和似然法,以及bootstrap和一致 性树。可以处理的数据类型有分子序列、基因频率、限制性位点、距离矩阵和二进制离散字符。
下载地址:
http://evolution.genetics.washington.edu/phylip.html
对于windows操作系统有三个下载文件(phylipw.exe, phylipwx.exe,
phylipwy.exe),下载之后解压到一个文件夹中,里面包含了所有的程序,手册也在其中。
画图程序(drawgram, drawtree)需要安装X windows开发环境,否则会报错。
用户界面:
程序通过一个菜单来控制,用户设置选项。数据从一个文本文件中读入程序,这个文本文件不能是有特殊格式的文字处理器(office word)。有些序列比对程序,如clustalX,可将数据文件写为PHYLIP格式。
而大部分的程序自动寻找在infile文件中的数据。如果它们没有找到这个文件,它们将提示用户自己输入数据文件名。输出的内容将被写到特定的文件 中,如:outfile和outtree。Outtree中的树是newick格式的,这是一个正式的标准,由1986年被主要系统发生软件包的作者所确 定的。
Getting started
注意保持记录。
记录每步的实验过程是非常重要的,甚至是在计算分析时。也许你会对许多的结果文件感到头痛,那么最好的方法就是给结果文件改一个有意义的名字。
序列比对。
PHYLIP的输入文件是比对过的序列,并且是PHYLIP格式的。文件的后缀名是.phy的。比对可用clustalX:
http://www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html
一定要把比对的序列保存为phylip格式的。
PHYLIP程序的运行
这些程序要按照一定的顺序来运行。前一个程序的输出作为下一个程序的输入。如何合理的组合这些程序也很关键。
在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。我们建议使用命令行方式,因为你也许能看到一些错误提示。它启动的方是:开始->所有程序->附件->命令提示符。
大部分PHYLIP程序运行方法相同。程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。输出结果写在outfile文件中。有些则写在outfile和outtree或plotfile中。
因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。比如,你用Dnadist得到了距离矩阵 (outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_out_F84,或其它名称,这样你就 能区别两次的结果了。 程序
距离方法:
顺序使用这些程序。首先,用dandist或protdist程序计算序列比对结果的距离矩阵。接着这个矩阵被fitch、kitsch或 neighbor程序转换为树。Dandist和protdist程序的输出文件是outfile。在运行fitch、kitsch或neighbor 前,outfile应该重命名为infile或另外的名字。fitch、kitsch和neighbor的输出文件是outfile和outtree。
Dnadist DNA距离矩阵计算器 Protdist 蛋白质距离矩阵计算器
Fitch 没有分子时钟的Fitch-Margoliash树 Kitsch 有分子时钟的Fitch-Margoliash树 Neighbor Neighbor-Joining和UPGMA树
基于字符的方法
这些程序读入一个序列对,它们的输出文件是outfile和outtree。
Dnapars DNA简约法
Dnapenny DNA简约法using branch-and-bound Dnaml DNA最大似然,无分子时钟 Dnamlk DNA最大似然,有分子时钟 Protpars 蛋白质简约法 Proml 蛋白质最大似然法
重抽样工具
该程序生成一系列的特殊的随机样本,保存在outfile中。这些样本在后继的分析中作为一个序列对文件,要设置选项M(use multiple datasets)。 Seqboot 生成随机样本,用bootstrap和jack-knife方法。 画树
这些程序可画newick格式的树。如,danml程序生成的树。Drawgram和drawtree生成文件为plotfile,而retree生成outtree。 Drawgram 画有根树 Drawtree 画无根树
Retree interactive tree-rearrangement 一致树
用多重树构建一致树。如,dnapars可生成多重树,可用consense程序来汇总。Bootstrap的结果也由它来汇总为一棵majority rule tree。
Consense draws consensus trees from multiple trees 树的距离
计算多个树间的基于拓朴结构的距离。该方法可用来比较不同分析方法的结果。 Treedist 计算树拓朴结构间的距离
Quick start
这里以DNA序列数据为例说明。构建和画树,用F84进化模式的NJ方法。 距离方法
比对你的DNA序列并且保存比对结果为PHYLIP格式,如:alignment.phy。启动dnadist程序,双击图标或在命令行中输入dnadist。
Dnadist首先检查该程序所在文件夹中是否有infile文件。如果没有找到infile,它就会提示你输入序列比对文件。
Dnadist: can't find input file \Please enter a new file name> alignment.phy
注意,将程序与数据文件放在同一个文件夹中,使用起来会容易一些。如果数据文件在另外的文件夹中,你就要输入该文件的全部路径,比如文件在D:/data文件夹中,
Dnadist: can't find input file \
Please enter a new file name> D:\\data\\alignment.phy
所有的PHYLIP程序都是菜单提示的。下面就是dnadist的菜单。每行都是以一个字母或数字开始的。通过输入每行前面的字母或数字,来修改相应的程序设置。例如,输入”D”按回车将循环得到不同的进化模式。修改完后输入“Y”,按回车,开始运行该程序。
Nucleic acid sequence Distance Matrix program, version 3.66 Settings for this run:
D Distance (F84, Kimura, Jukes-Cantor, LogDet)? F84 G Gamma distributed rates across sites? No T Transition/transversion ratio? 2.0 C One category of substitution rates? Yes W Use weights for sites? No
F Use empirical base frequencies? Yes L Form of distance matrix? Square M Analyze multiple data sets? No
相关推荐: