? 高可信度Small RNA及其前提Small RNA序列筛选(使用转录组组装结果中的non
protein-coding序列代替基因组数据,进行miRNA前提序列的提取,再展开分析);
(2)Repbase等数据库(至少2个数据库)比对(一系列non-coding RNA分析):选取
Repbase数据库来注释测序得到的小RNA序列,尽可能的发现并归类其中可能的repeat associate sRNA,并分别对测序数据(总数)以及Unique数据(种数)进行统计,区分出6个时间点中均有表达的共有序列、特异性表达的特有序列分析,提供分析数据及展示图。【4龄期L1 6龄期L2 蛹期L3 1年
成虫L4 2年成虫L5 4年成虫L6 六个时间段分别统计】。具体内容如下: ? U 数据 miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,siRNA暂不做)的组成,提供分析数据及展示图;
? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA组成分析,时序变化规律;
? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点共有序列及特有序列分析; ? 各发育节点差异序列表达趋势分析miRNA-STC,差异筛选; ? Small RNA 表达水平差异方差分析;
? 筛选高可信度miRNA及其前体miRNA序列,及高可信度miRNA及其前体miRNA序列在6个发育阶段的分布(使用转录组组装结果中的non protein-coding序列代替基因组
数据,进行miRNA前提序列的提取,再展开分析。或自有软件)
4.用Rfam、GenBank、starBase、CleaveLand等数据库,进行降解片段鉴定、及其差异分析
1)数据 U 的重复序列、降解片段鉴定分析,提供分析数据及展示图(希望尽最大努力) (1)数据 U Small RNA重复序列、降解片段鉴定
(2)数据 U 重复序列、降解片段在miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,
miRNAs,scRNA,siRNA暂不做)当中的比率分析。
2)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的重复序列、降解片段鉴定分析,提供分析数据及展示图(希望尽最大努力)
(1)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的Small RNA重复序列、降解片段鉴定 (2)在Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点少年上,miRNA,piRNA,rRNA,tRNA,snRNA,
snoRNA,microRNAs,miRNAs,scRNA,siRNA暂不做)重复序列、降解片段鉴定的比率分析;
5.新miRNA预测(利用Mireap 或mirdeep等数据库,对未注释的small RNA 进行预测,预测新Small RNA(对于
未知的small RNA,不要局限于模式生物,要利用所有的small RNA数据库结合mRNA数据,界定未知的small RNA。
或使用转录组组装结果中的non protein-coding序列部分代替基因组数据,进行新miRNA预测)。
20
或对18个样本数据粉笔记性整理归纳以及数据归一化处理,筛选高置信度的miRNA。鉴定测序得到的miRNA分别属于哪一类。NEW(针对已知并报道的前体序列中新发现的miRNA序列);Diff(本次实验中测序获得的序列与miRbase报道的序列碱基组成具有一定差异性,极有可能在测序的物种的特定阶段中,另一种miRNA异构体高表达);YES(代表了测序获得序列与miRBASE报道中完全一致)。有公司说用CGT101软件进行预测
除常规程序性分析外,提供以下分析数据及展示图:
1)基于比对位置及周边碱基序列预测茎环结构形成能力分析(二级结构预测)
2)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点新Small RNA预测结果,提供分析数据及展示图
(1)各发育节点分别预测出的新small RNA数量、及类型; (2)绘制新的Small RNA 的二级结构图,进行进化分析; (3)新small RNA基因的靶基因预测 6.靶基因预测、GO功能分类、聚类分析
http://wenku.http://www.china-audit.com//view/0960233987c24028915fc3ec.html→应特别关注其分析方法和数据库。选用TargetScan、miRanda、PicTar、miRDeep、
Tarbase、miRecords、miRbase、Mireap、PITA、MicroCosm、miRTarBase、miRGatorv2.0、MiRNAMap、miRDB、RNAhybrid、miRGen——中最适合的等数据库和预测工具,进行分析。
包括已知和预测出的Small RNA。除常规程序性分析外,提供以下分析数据及展示图: 1)预测分析,提供分析数据及展示图
(1)在U 数据全部基因中:能够预测出靶基因的基因数、未能预测出靶基因的基因数,
提供数量及展示图
? 数据 U 的靶基因预测
? 差异Small RNA 与靶基因调控网络。
(2)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的全部基因:能够预测出靶基因的基因数、
未能预测出靶基因的基因数,提供数量及展示图; ? 各发育节点Y 1、Y 2、Y 3、Y 4、Y 5、Y 6的靶基因预测 ? 差异Small RNA 与靶基因调控网络。
2)靶基因 GO 功能分类、表达模式,提供分析数据及展示图 (1)数据 U 的GO 功能分类
(2)各节点Y 1、Y 2、Y 3、Y 4、Y 5、Y 6的GO功能分类
(3)Small RNA (包括已知和预测出的Small RNA)的表达模式
? 基于TPM等方法计算,各发育阶段Y 1、Y 2、Y 3、Y 4、Y 5、Y 6 表达量模式;───────────────→ ? Y 1-U、Y 2-U、Y 3-U、Y 4-U、Y 5-U、Y 6-U 表达量间的差异分析;─────────────────→ ? Y 1-U、Y 2-U、Y 3-U、Y 4-U、Y 5-U、Y 6-U表达量差异的强度分析 ↓
21
3)表达模式聚类分析(是否进行或不进行时间纬度的层次聚类?) (1)总体聚类,提供分析数据及展示图
? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6及 U 的7样的差异miRNA双向层次聚类,7张图;
? 分析所聚类间的差异;
(2)分类聚类,提供分析数据及展示图
? 按照miRNA,piRNA,rRNA,tRNA,snRNA,snoRNA,microRNAs,miRNAs,scRNA,
siRNA暂不做)类型,分别进行各发育阶段Y 1、Y 2、Y 3、Y 4、Y 5、Y 6差异Small
RNA的双向层次聚类;
(3)靶基因功能通路富集分析,提供分析数据及展示图 4)KEGG Pathway注释、分类、表达模式,提供分析数据及展示图
(1)Cellular component,Molecular function,Biological process的3个注释 (2)KEGG Pathway注释、分类、表达模式 (按照mRNA的分析要求进行,不重复描述) (3)差异表达miRNAs靶基因和RNA-Seq中DEGs关联基因的KEGG Pathway注释
7.已知miRNA (包括已知和预测出的miRNA)的家族分析
将新预测的miRNA在基因组上定位,并寻找可能同时转录的miRNA。采用间距分别为3kb,5kb,10kb,50kb来进行cluster聚类分析。已知Small RNA包括注释的注释出的和预测出的;除常规程序性分析外,提供以下分析数据及展示图:
22
1)miRNA成簇分析,cluster水平上miRNA的差异表达分析
2)分别比较花绒寄甲miRNA 家族,与已知miRNA赤拟谷盗Tribolium castaneum、家蚕Bombyx
mori家族的差异(或黑腹果蝇Drosophila melanogaster、冈比亚按蚊Anopheles gambiae、意大利蜜蜂
Apis mellifera、埃及伊蚊Aedes aegypti等,但必须与“2. 转录组组装与分析” 所选定的种类保持一致),
提供图和数据;
3)长寿基因、线粒体基因簇分析(序列的获得→基因定位→系统进化→靶基因的预测→靶基因的功能。参
考基因组选择必须与“2. 转录组组装与分析”所选定的种类保持一致:赤拟谷盗、或家蚕)。提供图和数据(做图文献:miRNA-9基因家族进化分析及其靶基因预测 http://www.cjcb.org/news/upload/20110511-9.pdf)
8.miRNA前体(发夹结构)二级结构预测 (尽量做,并追求高精度)
参照“黄杨潮 miRNA 前体与成熟体预测方法的设计与实现 哈尔滨工业大学2011 年 6 月”、“翁露晖 用生物信息学方法预测水稻新的miRNA前体及其成熟miRNA 中山大学 2010年6月”等等方法。 利用数据库miRBase、miRNAMap、miRGe、TIGR、Rfam、Refseq、EST,等等。选用软件vMir、Linux、Blastn、RNAfold、MiRService、Soap、MiRscan、miRseeker、ProMiR II、ERPN、SVM 等。有公司说用CGT101软件进行预测 特别提醒:先做前体分析(否则后边的成熟体可能找不到或预测不出来)→再做成熟体→基因组分布→染色体分布 1)pre-miRNA预测,提供分析数据及展示图
(1)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各发育节点的pre-miRNA预测; (2)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6相互间预测结果差异分析; (3)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各自预测出的miRNA前体特征
? 长度分布;
? 环茎结构(数量、环长度)、自由能(折叠、最小)、GC含量; ? pre-miRNA靶基因预测
2)miRNA 成熟体鉴定(预测),提供分析数据及展示图
(1)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6各自的成熟体鉴定(预测),提供鉴定结果数据库; (2)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6相互鉴定结果的差异分析(列出很简单的表格); (3)Y 1、Y 2、Y 3、Y 4、Y 5、Y 6所鉴定出的miRNA成熟体靶基因预测,提供数据。 3)预测出的pre-miRNA及成熟体与mRNA的联合分析,提供分析数据及展示图 (1)预测出的pre-miRNA与mRNA联合分析,确定关联的mRNA; (2)鉴定出的成熟体与mRNA联合分析,确定关联的mRNA;
9.指定分析(注:包括已知的miRNA和预测出的新的miRNA)(提供指定基因保守片段、简并引物、
或基因片段信息,见附件。下同)
1)长寿基因与Small RNA 的重复序列的比对信息,提供分析数据及展示图
? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6、U 各自的长寿基因数量变化分析 ? Y 1、Y 2、Y 3、Y 4、Y 5、Y 6、U 各自的长寿基因重复序列变化比较 ? 特异性长寿基因筛选及功能注释
2)长寿基因与Small RNA 与 exon/intron 的比对信息分析(还有可能开发出一个分析程序来)
利用花绒寄甲的T、X1、X2、X3、X4、X5、X6拼接组装数据,及Small RNA 的Y 1、Y 2、Y 3、Y 4、Y 5、Y 6、U 数据,分析“可变剪切基因数、CDS内含子基因数、UTR内含子基因数、无内含子基因数、
23
●
●
●
●
●
●
●
相关推荐: