第一范文网 - 专业文章范例文档资料分享平台

[系统发育]摘PAMl学习笔记 - 蜗牛

来源:用户分享 时间:2025/5/28 12:05:15 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

PAML

与Branch sites model 1. 什么是Branch-site model?

Branch- site model其实是Branch model and site model的合集,在该model下,不仅假定位点间的omega值是变化的,同时也假定支系间的omega值是变化的。该model主要用于检测前景枝中正选择作用对部分位点的影响。 2. Branch-site model中都有哪些模型?

Model A=(model=2 NSsites=2);Model B= (Model=2 Nssites=3);Model C= (Model=3 Nssites=2);Model D= (Model=3 Nssites=3)。注意Model D 需要ncatG参数设置位点的类型(以omega值进行分类),可以使用的ncatG值有2或者3,在ModelA,ModelB and ModelC中,ncatG的取值是被自动忽略的。 3. 在Branch- site model中如何进行模型比较?

Model A与ω2=1的null Model进行比较,该null Model可以通过设定

fix_omega=1 and omega=1进行确定。The comparison of Model A and null Model 对应的df值为1;(注:在null Model中omega值的设定是ω2=1,这便限定了在null Model中,background中的sites均处于negative selection,foreground Branch 中的sites均处于neutral selection。而在alternative Model中,foreground Branch中的site对应的omega值是大于1的。因此,alternative Model and null Model之间的显著性水平检测可以直接用来检测foreground Branch中的positive selection 位点)

在Branch- site Model中,Model A还可以与site Model中的M1a进行显著性水平比较。若这两者之间存在显著性差异,则可以说明要么foreground

Branch受到的选择约束较为宽松,要么foreground Branch受到明显的正选择作用。

Model B通常与site Model中的M3进行显著性比较,对应的df值为2 Model C与site Model中的M1a进行比较,对应的df值为3.

Model D通常与site Model中的M3进行比较,若树文件为无根树,则df=1,若树文件为有根树,则df=2.

就Model的提出理念而言,Model A and Model B侧重于寻找在进化过程中受正选择作用的点,而Model D则与之不同,其不再局限于正选择作用,而是涉及到多种选择作用(divergent selective pressures)。 4. 在Branch-site Model中的其他注意事项

在Model C and Model D中,不同omega值的Branch类型不局限于两种,使用者可以自行设置多种Branch types,最多可以设置10-12种。

另外,在Model C中,其ω1是一个定值,而在Model D中,ω1则是一个自由变化的参数。

Maximum likelihood methods for detecting adaptive

evolution after gene duplication

导读:基因组数据的不断报道使得基于大数据分析的基因家族进化成为可能,在此基础上,本文提出了一种基于Maximum likelihood methods的方法,对基因家族形成过程中的适应性进化进行检测,并以灵长目的ECP-EDN基因家族为例对此方法进行了说明。

1. 选择压力支系特异性检验(Detecting lineage- specific changes in selective pressure)

若基因家族的分化是通过正选择作用推动的,则在复制事件之后,会立刻出现非同义替换速率大于同义替换速率的现象。但是,若这一基因家族在其余的时间都是受到purifying selection 的作用,那么仅仅是两个序列之间的比对是很难发现omega值大于1的位点。

鉴于这一问题,本文提出了用于检测基因复制后适应性进化的最大似然法,旨在完成以下目标:(1)同一个基因进化历史中不时间点的选择压力;(2)这些选择压力是否不同。

1.1 支系间选择压力可变模型(Models of variable selective pressures among branches) 1.1.1.模型介绍

(1)one- ratio model ,即Phylogenetic tree中所有sites的omega值是一个恒定值。ω0=ω1=ω2=ω3;

(2)Two- ratio model, 复制事件之前的omega值和复制事件之后的omega值不相等。ω0≠ω1=ω2=ω3;

90

图1 假设基因家族的进化树

Fig1 Phylogeny of a hypothetical gene family

(3)Three- ratio model, 该模型共假设三个omega值,即复制事件之前的omega值,复制事件之后的omega值,以及后期分支中的omega值。ω0≠ω1≠ω2=ω3。

(4)Four- ratio model, 该模型共假设四个omega,不仅复制事件前后的omega值不同以外,随后的分支上的两个omega值也不相同。即ω0≠ω1≠ω2≠ω3。 1.1.2 模型比较可以揭示的问题(likelihood ratio test)

(1) one ratio model with two ratio model : 揭示基因家族的复制前后所受的选择压力是否相同;

(2) two ratio model with three ratio model: 揭示基因家族复制后到分化前以及分化后这段时间的选择压力是否发生变化。

(3) three ratio model with four ratio model: 揭示基因家族中两个旁系同源分支之间的选择压力是否发生变化。

1.1.3 应用举例——ECP-EDN基因家族在基因复制之后非同义替换速率是否发生改变。

ECP,即嗜酸性粒细胞衍生神经毒素,EDN,即嗜酸性粒细胞阳离子蛋白。二者均是核糖核酸酶类,但其特异性功能发生了分化,ECP是阳离子毒素,对于寄生虫和细菌都有非特异性毒性。但EDN是一种有效地抗病毒药物通过有效地核酸降解。本文中对ECP-EDN基因家族在基因复制之后的非同义替换率进行了检验。

图2 ECP-EDN基因家族系统发育树

Fig 2 The phylogenetic tree of ECP-EDN gene family

本分析共设置了四个ratio Model,分别为one ratio Model, two ratio

Model, three ratio Model and four ratio Model。其中R1 和R2的LRT检测结果是显著的(P=0.0001),这说明在基因复制事件之后,非同义替换速率发生了显著的增加;R2和R3的LRT检测结果也是显著的,这说明在基因复制事件之后,ECP-EDN基因家族经历了适应性检测;R3和R4的LRT检测结果也是显著的,这表明ECP subclade 与EDN subclade所处的进化选择压力不同。 1.2 鉴定适应性进化的氨基酸位点(Identification of amino acid sites under positive selection)

从蛋白质进化的角度而言,为了维持蛋白质功能的稳定性,其平均非同义替换的数量往往较少。只有少数一部分氨基酸位点在进化过程中受到适应性进化的选择。因此,计算整个支系的平均omega值往往很难检测到positive

selection。鉴于此,我们需要对小部分的condons所受的正选择压力进行检测并确定存在这些正选择压力的位点的位置。

为完成上述目标,我们可以根据已知的结构域和功能域的信息,将氨基酸位点分成若干具有独立omega值的小位点合集。但是在不了解蛋白质的结构域和功能域的情况下,可以对 all amino acid sites 设计一个omega值分布(比如gamma 分布,beta 分布等)。通过对null Model 以及其衍生模型的LRT检验,验证是否存在positive sites的假说,若positive sites存在,则通过NEB或者BEB法检验这些位点的后验概率。

1.3 Lineage- specific changes in selective pressure at specific amino acid sites Model A: 指定ω0=0 且ω1=1,因此正选择作用只约束在了前景枝中;通常选择M1 与Model A进行LRT检测,自由度df=2;

Model B:ω0和ω1为自由参数(free parameters),所分析的整个支系中均有可能出现正选择作用位点。通常选择M3与Model B进行LRT检测,自由度df=2;

搜索更多关于: [系统发育]摘PAMl学习笔记 - 蜗牛 的文档
[系统发育]摘PAMl学习笔记 - 蜗牛.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c6dnlq6cysc6cyp37mp7h_4.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top