第一范文网 - 专业文章范例文档资料分享平台

16S信息分析报告2-北京奥维森

来源:用户分享 时间:2025/6/24 12:12:26 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

北京奥维森基因科技有限公司

16srDNA信息分析

1.标准信息分析(初级)

1.1 基本数据处理(使用内部撰写的程序对原始的测序数据进行基本处理)

通过Illumina平台(Miseq)进行Paired-end测序,下机数据经过去除低质量reads(Q20, 90%标准过滤),并trim掉reads2 尾部100bp 低质量序列;每个样品数据产出详细统计结果见下表:

表1-1 reads数据统计:

CA HC LK Total

# Samples 17 19 13 49

# HQ reads (total) 110,651 163,690 127,416 401,757

# HQ reads (mean±SD) 6,509±2,175 8,615±3,081 9,801±2,858 8,199±2,992

注:原来的样本中CA15由于原始Reads数太少(只有23条)而被删除,因此目前的样本总数为49个

1.2 去除 barcode 序列,引物序列及 tags过滤

通过COPE软件(Connecting Overlapped Pair-End,V1.2.3.3),利用重叠关系将双末端测序得到的成对reads组装成一条序列。

利用内部编写程序去除两端barcode 序列,引物序列。

Paired End Reads通过reads之间的overlap (19个碱基)关系拼接成Tags;然后去掉barcode序列,引物序列。为了得到高质量的Tags,将拼接的Tags按照长度过滤,去嵌合体等的处理。(这里等的意思就是按照拼接条件过滤:1, 碱基的ASCII value值低于33的过滤掉。2.overlap取19个碱基,这19个碱基相互匹配率低于98%的过滤掉。3.去掉引物序列的时候,允许一个错配,错配多于一个的过滤掉。)

表1-2 tags的详细信息

Sample ID Raw Tag Num Final Tag num

HC1 HC2 HC3 HC4 HC5 HC8

17560 9672 18053 12181 11558 11488

17,319 9,604 17,826 12,107 11,477 11,404

北京奥维森基因科技有限公司

HC9 HC10 HC11 HC12 HC13 HC14 HC15 HC16 HC17 HC18 HC19 CA8 CA10 CA11 CA12 CA14 CA16 CA17 CA18 CA5 CA9 CA13

16354 21584 7989 11561 24909 22979 20747 14857 21171 10700 11359 16203 10925 8254 9479 7947 8221 10666 10787 16344 6047 10290

16,095 21,270 7926 11,449 24,660 22,736 20,549 14,728 21,002 10,605 11,247 16,040 10,560 7,690 9,053 7,584 8,093 10,479 10,651 16,154 5,861 10,165

2 高级信息分析

2.1 OUT及其丰度分析

2.1.1 OUT统计

拼接的Tags经过优化后,在0.97相似度下利用qiime(v1.8.0)软件将其聚类为用于物种分类的OTU(Operational Taxonomic Units),统计各个样品每个OTU中的丰度信息,OTU的丰度初步说明了样品的物种丰富程度。49个样品共产生3029个OTU,其中Singletons OTU(即丰度为1的OTU)个数为0,Non singletons OTU个数为3029。

表4.样品OUT统计

SampleName

HC1 HC2 HC3

OTUs 541 269 530

Tags 17,319 9,604 17,826

北京奥维森基因科技有限公司

HC4 HC5 HC8 HC9 HC10 HC12 HC13 CA10 CA11 CA12 CA14 CA16 CA17 CA18 CA5 CA9 HC11 CA13

表5 OTU 统计

215 206 214 455 600 262 294 453 710 650 519 240 330 289 336 347 142 269 12,107 11,477 11,404 16,095 21,270 11,449 24,660 10,560 7,690 9,053 7,584 8,093 10,479 10,651 16,154 5,861 7,926 10,165

Index

No. of OTUs

Assigned to families Assigned to genera Assigned to species No. of OTUs per sample Min no. of OTUs per sample Max no. of OTUs per sample

OTU num 3029 1,708 1,172 314 368±147 127 719

2.1.2 OTU分布的韦恩图如下:

在0.97的相似度下,得到了每个样品的OTU个数,利用R(v3.1.1)画图软件绘出Venn图可以展示多样品共有和各自特有OTU数目,直观展示样品间OTU的重叠情况。结合OTU所代表的物种,可以找出不同环境中的核心微生物。

北京奥维森基因科技有限公司

图2-1 OTU venn 分析。不同颜色图形代表不同样品或者不同组别,不同颜色图形之间交叠部分数字为两个样品或两个组别之间共有的OTU个数。同理,多个颜色图形之间交叠部分数字为多个样品或组别之间共有OTU个数。Venn图容许2-5个样品或组别。

2.1.3 OUT水平的PCA图如下:R(v3.1.1)画图软件

PCA 分析(Principal Component Analysis),即主成分分析,是一种分析和简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品OTU(97%相似性)组成可以反映样品的差异和距离,PCA运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值两个特征值。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。

搜索更多关于: 16S信息分析报告2-北京奥维森 的文档
16S信息分析报告2-北京奥维森.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c82kr30lhf703gjy5zd2f62h6002tw800l8d_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top