I Input sequences interleaved? Yes
0 Terminal type (IBM PC, ANSI, none)? ANSI 1 Print out the data at start of run No 2 Print indications of progress of run Yes
Y to accept these or type the letter for one to change y
两两序列的距离保存在outfile文件中。你可以将它重命名为outfile.txt,那么以后双击它时就可自动用记事本打开了。 Distances calculated for species Rabbit .... Human ... Opossum .. Chicken . Frog
Distances written to file \Done.
接着把outfile重命名为infile,运行neighbor程序(输入neighbor)。该程序从infile文件中读取距离数据。这里不需要设置,输入Y按回车。 Neighbor-Joining/UPGMA method version 3.66 Settings for this run:
N Neighbor-joining or UPGMA tree? Neighbor-joining O Outgroup root? No, use as outgroup species 1 L Lower-triangular data matrix? No R Upper-triangular data matrix? No S Subreplicates? No
J Randomize input order of species? No. Use input order M Analyze multiple data sets? No
0 Terminal type (IBM PC, ANSI, none)? ANSI
1 Print out the data at start of run No 2 Print indications of progress of run Yes 3 Print out tree Yes
4 Write out trees onto tree file? Yes
Y to accept these or type the letter for one to change y
运行完之后,树包含在outfile和outtree。可以用文本编辑器来看outfile中的树。 画树
下面我们用drawgram程序把outtree画成一棵好看的树吧。首先,把outtree重命名为intree,并把font文件的其中一个重 命名为fontfile,启动drawgram程序。该程序首先寻找文件fontfile,如果找不到它(如果你没有把字体文件之一改为fontfile 的话),它会提示输入一个字体文件。接着就会出现菜单。你需要将选项P对应的最终画图设备改为MS-windows bitmap。它还要要求你输入树的维数,比如说640x400。设置好后输入Y按回车。
Drawgram打开一个新的窗口,你可以看到一棵树,如果你满意这个结果,选择file菜单中的plot。在当前文件夹中出现一个plotfile文件。如果你将它重命名为plotfile.bmp,就可用图形工具将它打开了。
树支的长度是核苷酸或氨基酸改变的数目,改变的数目用dandist程序进化模式来估算。
氨基酸序列
所用的程序与上面所举的例子类似。只要把dnadist换成protdist就行了。
################# 详细说明 #################
除了基于距离的方法外,还有基于字符的方法:最大简约法和最大似然法。 根据实际情况,除了数据分析和画之外,我们还要验证数据的可靠性,比如用bootstrap方法。
如果运行有些程序之前,你还运行过别的程序,在文件夹中已经存在了outfile文件的话,程序会有这样的提示:
Dnadist: the file %use as output file already exists. Do you want to Replace it, Append to it, write to a new File, or Quit? (please type R, A, F, or Q)
#####DNA数据####
Dnadist的菜单
Nucleic acid sequence Distance Matrix program, version 3.66 Settings for this run:
D Distance (F84, Kimura, Jukes-Cantor, LogDet)? F84 G Gamma distributed rates across sites? No T Transition/transversion ratio? 2.0 C One category of substitution rates? Yes W Use weights for sites? No
F Use empirical base frequencies? Yes L Form of distance matrix? Square M Analyze multiple data sets? No I Input sequences interleaved? Yes
0 Terminal type (IBM PC, ANSI, none)? ANSI 1 Print out the data at start of run No
2 Print indications of progress of run Yes
D——距离计算方法,进化模式。是争对替换问题和转换颠换的。Jukes-Cantor距离假设所有替换的概率都相等。Kimura距离有两个不同 的替换率,一个对应转换,一个对应颠换。这些模式都假设每个碱基的频率是相等,且等于0.25。F84距离,转换和颠换率不同,碱基的频率也不同。 LogDet距离在序列间有较大的碱基频率差异时使用。LogDet距离不能复制含糊的代码,必须是确定的序列。
PHYLIP构建进化树的完整详细过程 一、获取序列
一般自己通过测序得到一段序列(已知或未知的都可以),通过NCBI的BLAST获取相似性较高的一组序列,下载保存为FASTA格式。用BIOEDIT等软件编辑序列名称,注意PHYLIP在DOS下运行,文件名不能超过10位,超过的会自动截留前面10位。 二、多序列比对
目前一般应用CLASTAL X进行,注意输出格式选用PHY格式。生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,但是注意不是真正的进化树。 三、构建进化树 1.N-J法建树
依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。具体步骤如下: (1)打开seqboot.exe
输入文件名:输入你用CLASTAL X生成的PHY文件(*.phy)。
R为bootstrap的次数,一般为1000 (设你输入的值为M,即下两步DNADIST.EXE、NEIGHBOR.EXE中的M值也为1000) odd number: (4N+1)(eg: 1、5、9…) 改好了y
得到outfile(在phylip文件夹内) 改名为2
(2)打开Dnadist.EXE 输入2
修改M值,再按D,然后输入1000(M值) y
得到outfile(在phylip文件夹内)
改名为3
(3)打开Neighboor.EXE 输入3
M=1000(M值) 按Y
得到outfile和outtree(在phylip文件夹内) 改outtree为4,outfile改为402 (4)打开consense.exe 输入4 y
得到outfile和outtree(在phylip文件夹内) Outfile可以改为*.txt文件,用记事本打开阅读。 四、进化树编辑和阅读
outtree可改为*.tre文件,直接双击在treeview里看;也可以不改文件扩展名,直接用treeview、PHYLODRAW、NJPLOT等软件打开编辑。TREEVIEW可以显示BOOTSTRAN值,序列较多(60条以上)的时候打开直接显示有明显的重叠,可以在打印预览中显示,或输出为EMF WMF图片文件看,但是序列较多时BOOTSTRAN值的显示位置比较乱,和序列名称有重叠。
PHYLODRAW的编辑功能较强,可以自由调节X、Y轴的长度。输出格式为BMP、PS格式。缺点是不能直接显示BOOTSTRAN值,包括打开TREEVIEW输出的NEX文件,而且输出的BMP文件不全,类似截屏文件,我用PHOTOSHOP进行拼接合成,添加BOOTSTRAN值和注解符号等。据说也可以将PS文件用记事本打开,改变其中的字号,然后通过ADOBE DISTRILLOR将PS转化为PDF,就可以解决问题。如果发现还有重叠,可以再次改变PS文件中的字号大小,直到合适为止。
NJPLOT可以显示BOOTSTRAN值和分值长度。但是不能调节图片X、Y轴的长度。
建MP,ML树将Dnadist和Neighboot两步分别改为Dnapars和Dnaml,其余步骤相同。据说ML法序列较多是非常耗时,我没有尝试。因为我的序列较多。
也可以用CLASTAL X中的BOOTSTRAN N-J TREE法生成进化树,TREE菜单输出格式选项(OUTPUT FORMAT OPTION)中的BOOTSTRAN LABELS ON 选NODE(节点)。在treeview里,选择tree菜单 ,然后把show internal edge lables 的选项打勾了,直接打开生成的文件bootstrap的值就可以显示出来。
相关推荐: