长链非编码RNA(long noncoding RNAs,LncRNAs)是一类长度超过200nt的非编码RNA分子,其表达水平相对于蛋白编码基因较低,但它们在X染色体沉默、基因组印迹、染色体修饰、转录激活、转录干扰以及核内运输等方面具有重要的功能,广泛参与细胞周期调控、生长发育、胚胎干细胞分化等多种生物学过程。lncRNA 一般可分为五类,分别为:同义lncRNA、反义lncRNA3、双向lncRNA、内含子lncRNA和基因间lncRNA。
lncRNA转录可以干扰沉默基因,它的转录同样可以对邻近基因的表达能力产生深远的影响,还可以穿过下游蛋白质编码基因启动子区域的lncRNA直接干扰转录因子与启动子的结合,并因此阻止蛋白质编码基因的表达,同样LncRNA转录的进行引起组蛋白修饰,从而阻止在转录体内部位点起始虚假基因转录[1]。LncRNA由于序列保守性较低,其发挥作用可能并不是依赖于严格的序列保守性,而是依靠二级空间结构来发挥作用。
一些LncRNA通过与染色质相互作用和招募染色质修饰结构来调节多种基因的转录沉默,通过招募多梳复合物在顺式位置形成其转录位点的抑制结构域、可与抑制性复合物CoR结合作用于甲基化酶对多梳蛋白Pc2进行甲基化修饰,进而结合E2F1因子形成抑制性复合、结合转录因子,直接顺式调节基因的转录、与不同不同功能的几类效应分子构成大分子复合体,然后与靶基因结合,形成蛋白质-RNA-DNA异源多聚体调节基因的转、在转录后水平可通过和互补的mRNA形成双链RNA,影响mRNA加工、剪接、转运、翻译和降解等过程,从而调节基因的表达[2]。据有关报道,功能相同或相近的蛋白具有相似的表达倾向。 共表达网络,即表达趋势一致的基因网络,已经被证实是一个对未知蛋白编码基因进行功能注释的有效方法之一[3]。
同样,LncRNA 与蛋白编码基因的双色共表达网络也是对LncRNA 进行功能注释的有效可行的方法。已有研究报道,一部分LncRNA 倾向调节基因组上临近的蛋白编码基因。 因此,基于基因组共定位的方法,即挖掘既共表达又在基因组上临近( 比如,距离不超过100kb) 的LncRNA蛋白编码基因关系,将蛋白编码基因的功能赋予该 LncRNA基于网络 Hub的方法,则以 LncRNA 作为中心节点,寻找与该LncRNA 直接相连( 共表达) 的蛋白编码基因,计算这些蛋白编码基因富集的功能,并赋予该中心节点LncRNA[3]。LncRNA在表观遗传、转录调控和转录
后调控等多个层次上发挥着重要作用。
一些LncRNA可以通过与染色质相互作用和招募染色质修饰结构来调节多种基因的转录沉默, 地通过招募多梳复合物在顺式位置形成其转录位点的抑制结构域,同样可与抑制 性复合物CoR结合作用于甲基化酶对多梳蛋白进行甲基化修饰,进而结合E2F1因子,形成抑制性复合体。 LncRNA与不同功能的几类效应分构成大分子复合体,然后与靶基因结合\形成蛋白质-RNA-DNA异源多聚体调节基因的转录。 其在转录后水平可通过和互补的mRNA形成双链RNA影响mRNA的加工剪接、转运、翻译和降解等过程,从而调节基因的表达[4]。
近年来非编码RNA的研究持续升温,从1999年开始到 2010年的 12年间有 6 年,非编码 RNA相关研究成果都入选美国《科学》(Science)杂志的年度十大科技突破。特别是 2010年 12月 17日《科学》杂志在评选进入21世纪后第一个 10年的十大科学突破时,非编码领域被放在了第一位。2004年,Science以“隐蔽的 DNA 宝藏”为题,指出在占人类基因组90%以上的所谓“无用 DNA”(Junk DNA)序列中可能暗藏着大量的DNA调控元件。转座子和非编码RNA 基因 )2012 年,人类DNA 元件百科全书计划(ENCODE)的最新结果表明大约 80%的 DNA序列都能转录成RNA数目巨大,种类繁多的非编码RNA 占细胞总 RNA的绝大部分.这些非编码 RNA无处不在,而且参与了包括从干细胞维持!胚胎发育!细胞分化、凋亡、代谢、信号传导、感染以及免疫应答等几乎所有生理或病理过程的调控,由此可见,非编码RNA 的发现及其调控功能、机理的阐明,对现代生命科学具有重大的意义[4]。
lncRNA通过支架蛋白质以形成新的复合体,或引导转录组因子以抑制特定基因的表达,或通过其他机制对生命体活动产生重要的功能作用如图[1]所示[4]。
图1 lncRNA的潜在功能
目前,常用的一种LncRNA策略包括LncRNA的筛选、确定、功能分析、功能研究和表达调控几方面如图[2]所示
1、 LncRNA筛选:通过LncRNA芯片或RNA-seq测序等方法对多对疾病模型和对照样本
组织进行LncRNA表达谱分析。
2、 lncRNA确定:通过5' RACE获取lncRNA 5'全长,3' RACE获取lncRNA3'全长,最终
拿到完整的lncRNA序列。
3、 生物信息分析:通过生物信息学的方法筛选出具有表达差异的LncRNA,构建共表达网
络,预测LncRNA的靶基因。
4、 功能研究:(1)功能获得性研究:构建LncRNA共表达载体。(2)功能缺失性研究:可
通过siRNA、shRNA、反义核酸等方法沉默LncRNA,干预LncRNA后监测其对疾病相关基因表达的影响和对细胞表型如增值、凋亡、侵袭、转移等的影响。(3)可通过RNA pull down、RNA-RIP、Chl RP-seq等方法监测与LncRNA结合的DNA、RNA、蛋白质。
5、 表达调控:(1)将lncRNA表达与其他领域相结合,解释lncRNA调控机理。(2)
DNA甲基化:可通过检测相应基因甲基化差异与lncRNA结合分析。(3)转录因子:研究lncRNA与转录因子的调控机制。染色质重塑:lncRNA表观调控。
图 2 LncRNA研究策略
参考文献
[1] 祁磊, 苗俊英. 长非编码RNA. 生命的化学, 2011, 31(3): 378-384. [2] 王国强,卫宁,王禹,庞卫军. 长链非编码RNA的生物学功能研究进展. 家畜生态学报. 2014,3 第35卷 第3期
[3] 王国强,卫宁,王禹,庞卫军. 长链非编码RNA的生物学功能研究进展. 家畜生态学报. 2014,3 第35卷 第3期
[4] 孙 磊, 张 林, 刘 辉. 基于Rna-seq的长非编码RNA预测. 生物化学与生物物理进展. 2012, 39,(12); 1155~1156
[5] 陈晓敏,张栋栋,骆健俊等. 长非编码RNA研究进展. 生物化学与生物物理进展, 2014,41(10): 997-1009.
相关推荐: