第一范文网 - 专业文章范例文档资料分享平台

phylip软件使用及使用的详细过程

来源:用户分享 时间:2025/6/3 4:35:44 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

phylip软件使用

PHYLIP是一个综合的系统发生分析软件包,由华盛顿大学的Joseph Felsenstein开发的。现在该软件包可完成许多系统发生分析。软件包中可用的方法包括了简约法、距离矩阵和似然法,以及bootstrap和一致 性树。可以处理的数据类型有分子序列、基因频率、限制性位点、距离矩阵和二进制离散字符。

下载地址:

http://evolution.genetics.washington.edu/phylip.html

对于windows操作系统有三个下载文件(phylipw.exe, phylipwx.exe,

phylipwy.exe),下载之后解压到一个文件夹中,里面包含了所有的程序,手册也在其中。

画图程序(drawgram, drawtree)需要安装X windows开发环境,否则会报错。

用户界面:

程序通过一个菜单来控制,用户设置选项。数据从一个文本文件中读入程序,这个文本文件不能是有特殊格式的文字处理器(office word)。有些序列比对程序,如clustalX,可将数据文件写为PHYLIP格式。

而大部分的程序自动寻找在infile文件中的数据。如果它们没有找到这个文件,它们将提示用户自己输入数据文件名。输出的内容将被写到特定的文件 中,如:outfile和outtree。Outtree中的树是newick格式的,这是一个正式的标准,由1986年被主要系统发生软件包的作者所确 定的。

Getting started

注意保持记录。

记录每步的实验过程是非常重要的,甚至是在计算分析时。也许你会对许多的结果文件感到头痛,那么最好的方法就是给结果文件改一个有意义的名字。

序列比对。

PHYLIP的输入文件是比对过的序列,并且是PHYLIP格式的。文件的后缀名是.phy的。比对可用clustalX:

http://www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html

一定要把比对的序列保存为phylip格式的。

PHYLIP程序的运行

这些程序要按照一定的顺序来运行。前一个程序的输出作为下一个程序的输入。如何合理的组合这些程序也很关键。

在windows中,PHYLIP程序可通过双击程序的图标来启动,或是在命令行中输入程序的名称来启动。我们建议使用命令行方式,因为你也许能看到一些错误提示。它启动的方是:开始->所有程序->附件->命令提示符。

大部分PHYLIP程序运行方法相同。程序把infile作为默认输入文件,如果没有找到它将要求用户输入数据文件的名称。输出结果写在outfile文件中。有些则写在outfile和outtree或plotfile中。

因为大部分程序使用默认的输入和输出文件名,所以在下一步的分析前,要重命名你想保存的文件。比如,你用Dnadist得到了距离矩阵 (outfile),你还想试试不同的设置,那么再做矩阵计算前,你可以把outfile重命名为dnadist_out_F84,或其它名称,这样你就 能区别两次的结果了。 程序

距离方法:

顺序使用这些程序。首先,用dandist或protdist程序计算序列比对结果的距离矩阵。接着这个矩阵被fitch、kitsch或 neighbor程序转换为树。Dandist和protdist程序的输出文件是outfile。在运行fitch、kitsch或neighbor 前,outfile应该重命名为infile或另外的名字。fitch、kitsch和neighbor的输出文件是outfile和outtree。

Dnadist DNA距离矩阵计算器 Protdist 蛋白质距离矩阵计算器

Fitch 没有分子时钟的Fitch-Margoliash树 Kitsch 有分子时钟的Fitch-Margoliash树 Neighbor Neighbor-Joining和UPGMA树

基于字符的方法

这些程序读入一个序列对,它们的输出文件是outfile和outtree。

Dnapars DNA简约法

Dnapenny DNA简约法using branch-and-bound Dnaml DNA最大似然,无分子时钟 Dnamlk DNA最大似然,有分子时钟 Protpars 蛋白质简约法 Proml 蛋白质最大似然法

重抽样工具

该程序生成一系列的特殊的随机样本,保存在outfile中。这些样本在后继的分析中作为一个序列对文件,要设置选项M(use multiple datasets)。 Seqboot 生成随机样本,用bootstrap和jack-knife方法。 画树

这些程序可画newick格式的树。如,danml程序生成的树。Drawgram和drawtree生成文件为plotfile,而retree生成outtree。 Drawgram 画有根树 Drawtree 画无根树

Retree interactive tree-rearrangement 一致树

用多重树构建一致树。如,dnapars可生成多重树,可用consense程序来汇总。Bootstrap的结果也由它来汇总为一棵majority rule tree。

Consense draws consensus trees from multiple trees 树的距离

计算多个树间的基于拓朴结构的距离。该方法可用来比较不同分析方法的结果。 Treedist 计算树拓朴结构间的距离

Quick start

这里以DNA序列数据为例说明。构建和画树,用F84进化模式的NJ方法。 距离方法

比对你的DNA序列并且保存比对结果为PHYLIP格式,如:alignment.phy。启动dnadist程序,双击图标或在命令行中输入dnadist。

Dnadist首先检查该程序所在文件夹中是否有infile文件。如果没有找到infile,它就会提示你输入序列比对文件。

Dnadist: can't find input file \Please enter a new file name> alignment.phy

注意,将程序与数据文件放在同一个文件夹中,使用起来会容易一些。如果数据文件在另外的文件夹中,你就要输入该文件的全部路径,比如文件在D:/data文件夹中,

Dnadist: can't find input file \

Please enter a new file name> D:\\data\\alignment.phy

所有的PHYLIP程序都是菜单提示的。下面就是dnadist的菜单。每行都是以一个字母或数字开始的。通过输入每行前面的字母或数字,来修改相应的程序设置。例如,输入”D”按回车将循环得到不同的进化模式。修改完后输入“Y”,按回车,开始运行该程序。

Nucleic acid sequence Distance Matrix program, version 3.66 Settings for this run:

D Distance (F84, Kimura, Jukes-Cantor, LogDet)? F84 G Gamma distributed rates across sites? No T Transition/transversion ratio? 2.0 C One category of substitution rates? Yes W Use weights for sites? No

F Use empirical base frequencies? Yes L Form of distance matrix? Square M Analyze multiple data sets? No

搜索更多关于: phylip软件使用及使用的详细过程 的文档
phylip软件使用及使用的详细过程.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c8t7180oh073pit885vmg_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top