与PCA分析的主要差异在于考量了进化上的信息。
每一个点代表一个样本,相同颜色的点来自同一个分组,两点之间距离越近表明两者的群落构成差异越小。
12. 12
PCA分析
主成分分析PCA(Principal component analysis)是一种研究数据相似性或差异性的可视化方法,通过一系列的特征值和特征向量进行排序后,选择主要的前几位特征值,采取降维的思想,PCA 可以找到距离矩阵中最主要的坐标,结果是数据矩阵的一个旋转,它没有改变样品点之间的相互位置关系,只是改变了坐标系统。详细关于主成分分析的解释推荐大家看一篇文章,http://blog.csdn.net/aywhehe/article/details/5736659 。通过PCA 可以观察个体或群体间的差异。
每一个点代表一个样本,相同颜色的点来自同一个分组,两点之间距离越近表明两者的群落构成差异越小。
以上三个图可能遇到的问题:
1:PCA,PcoA,NMDS分析分别是基于什么数据画的?
回答:PCA,PcoA,NMDS分析均是基于OTU分类taxon数据所画,用的是R语言Vegan包中的相关函数画成,其中PcoA与NMDS还要基于样本之间的距离矩阵才能画成。
2:PCA分析如果图中大部分点集中在一起,少数点在很远的外围,是什么原因造成的?
回答:是因为样本OTU分类时候,少数样本某些菌含量特别高所造成,导致这些样本偏离正常范围,建议单独拿出这些样本观察,看是否是实验错误。
3:PCA分析时,不是有PC1,PC2,PC3三个坐标吗?是给出三张图吗?还是三维立体图?
回答:PCA作图时,会得出PC1,PC2,PC3三个坐标,可以根据PC12,PC13,PC23分别作图,一般给出的是PC12的图,当PC12图质量不好,看不出明显的样本分类效果时,可以看PC13或PC23的图分类是否清晰,也可以用R语言rgl包做出PC123三维图。
QIIME本身结果中有提供PCA的三维图结果,可以通过网页打开。
13. 13
LDA差异贡献分析
PCA和LDA的差别在于,PCA,它所作的只是将整组数据整体映射到最方便表示这组数据的坐标轴上,映射时没有利用任何数据内部的分类信息,是无监督的,而LDA是由监督的,增加了种属之间的信息关系后,结合显著性差异标准测试(克鲁斯卡尔-沃利斯检验和两两Wilcoxon测试)和线性判别分析的方法进行特征选择。除了可以检测重要特征,他还可以根据效应值进行功能特性排序,这些功能特性可以解释顶部的大部分生物学差异。详细说明可以参考这篇文章http://blog.csdn.net/sunmenggmail/article/details/8071502 。
不同颜色代表不同样本或组之间的显著差异物种。使用LefSe软件分析获得,其中显著差异的logarithmic LDA score设为2。
问题:LDA分析有什么用?
回答:组间差异显著物种又可以称作生物标记物(biomarkers),该分析主要是想找到组间在丰度上有显著差异的物种。
相关推荐: