第一范文网 - 专业文章范例文档资料分享平台

基因相关名词解释级NCBI序列案例

来源:用户分享 时间:2025/12/4 23:59:31 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

一、基因

基因在结构上,分为编码区和非编码区两部分(其中非编码区对基因的表达主要起调控作用,如启动子等位于该区)。真核生物基因的编码区是不连续的(真核生物结构基因,由若干个编码序列和非编码序列互相间隔开但又连续镶嵌而成,去除非编码序列再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因split gene),分为外显子(Exon)和内含子,其中外显子是可以最终实现表达的(表现在蛋白质的一级结构上),内含子则最终不能表达(所以真核生物基因表达过程中,转录产物——信使RNA不能直接进行翻译,而是要修剪掉内含子部分后才能去指导翻译)。原核生物的基因也有编码区、非编码区,但是编码区内是连续的编码区列,无外显子、内含子的区分。

1.正义链:

DNA上携带有编码蛋白质氨基酸信息的核苷酸序列的链称为正义链,又称编码链,与mRNA核苷酸序列相同(U代替T)。另一条链核苷酸序列与正义链互补,按碱基配对规律能指引转录生成RNA单链,称为模板链、反义链。

2.编码区、开放阅读框、编码序列、CDS的区别和关系? ①编码序列:

真核细胞基因结构中的编码序列是位于编码区的核苷酸序列,也就是说,编码区包括全部编码序列(外显子)和一些非编码序列(内含子),剩下的非编码序列存在于非编码区。 ②CDS:

CDS是编码序列(Coding sequence)的缩写。DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一一对应的DNA序列,且该序列中间不含其它非该蛋白质对应的序列,不考虑mRNA加工等过程中的序列变化。总之,就是与蛋白质的密码子完全对应。 ③ORF(开放阅读框):

开放阅读框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或能产生生物学功能的蛋白。比如当一个新基因被识别,其DNA序列被解读,有若干个开放阅读框,但人们仍旧无法搞清相应的蛋白序列是什么。 ?因此:CDS可能是一个ORF,也可能是包括多个ORF;ORF不一定都是CDS。

3.启动子:

参与特定基因转录及其调控的TSS上游序列称为启动子(Promoter),如原核生物在转录起

始位点上游-10有一段TATAAT的保守序列,有助于局部解链,在-35有一段TTGACA序列提供RNA聚合酶识别信号,真核生物上游-25到-30TATA决定起始位点,-75位置CAAT与RNA聚合酶,这些都是启动子,启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。

4.STS(sequence-tagged site):

序列标记位点,是基因组上定位明确、作为界标并能通过PCR扩增被唯一操作的短的、单拷贝DNA序列,一般长度为200-500bp。一个DNA序列要成为STS,首先序列必须已知,能用PCR方法检测,第二STS必须在基因组上具有唯一的定位点。通过STS可以判断在不同条件下测序得到的DNA序列的准确性。

5.EST(expressed sequence tag):

表达序列标签,是从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA序列。全基因组测序发现基因即昂贵又费时,因为基因组中只有2%序列编码蛋白质,因此可以对真正编码蛋白质的mRNA构建cDNA文库,对cDNA进行测序,得到EST序列,从而发现新基因。

6.cDNA克隆:

克隆可以简单理解为复制品,例如假设通过提取mRNA,反转录后得到cDNA序列,然后将这段序列转入载体,再通过划线不断的繁殖,就会得到许多装有这段cDNA序列的克隆,实验室为了方便,在给得到的这些克隆起名时,一般会取cDNA序列的名,但实际上在这个克隆里面不仅包括了这个cDNA,还包括了载体的DNA。

二、RNA

1. hnRNA(不均一核RNA):

遗传信息从DNA分子转录到RNA分子中的过程称为转录(transcription)。在真核生物中,最初转录生成的RNA称为不均一核RNA(heterogeneous nuclear RNA,hnRNA)。是存在于真核生物细胞核中的不稳定的、大小不均的一组高分子RNA(分子量约为105~2×107,沉降系数约为30—100S)之总称。这些hnRNA在受到加工之后,移至细胞质,作为mRNA而发挥其功能。大部分的hnRNA在核内与各种特异的蛋白质形成复合体而存在着。

2.密码子:

是指mRNA分子中每相邻的三个核苷酸编成一组,在蛋白质合成时,代表某一种氨基酸的规律。 其中:起始密码子有AUG(真核生物)或GUG(原核生物);终止密码子有UAA、UAG、UGA 。

3.非编码RNA:

非编码RNA指的是不被翻译成蛋白质的RNA,这些RNA不被翻译成蛋白质,但是其中有一些会参与蛋白质翻译过程。

Eg:mRNA中的非翻译区,含有核糖体识别元件如5'-UTR、3'-UTR等; miRNA与转录基因互补,介导基因沉默(RNAi);

gRNA又称引导RNA,真核生物中参与RNA编辑的具有与mRNA互补序列的RNA;

snRNA、snoRNA等参与RNA剪接和RNA修饰;

eRNA,从内含子或DNA非编码区转录的RNA分子,精细调控基因的转录和翻译效率;

SNP RNA,信号识别颗粒RNA,细胞质中与含信号肽mRNA识别,决定分泌的RNA功能分子; pRNA,噬菌体RNA,fi29噬菌体中用6个同样的小RNA分子利用ATP参与DNA的包装;

tmRNA,具有tRNA样和mRNA样复合的RNA,广泛存在细菌中,识别翻译或读码有误的核糖体,也识别那些 延迟停转的核糖体,介导这些有问题的核糖体的崩解。

三、基因翻译表达

1.顺式作用元件(cis-acting element):

存在于基因旁侧序列中能影响基因表达的序列。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等,它们的作用是参与基因表达的调控。顺式作用元件本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。

2.转录因子(transcription factor):

是一群能与基因5`端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。

3.可变剪接:

有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接alternative splicing) 。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。

4.可变剪接体:

由DNA转录得到的,mRNA包含若干外显子,经过剪接组合成不同长度的mRNA,翻译成不同长度蛋白质.这种由同一基因不同外显子组成的序列称可变剪接体,又称剪接变异体。

5.Knockdown(敲低):

是将基因表达水平下调,可以是外源的(RNAi)也可以是内源的(甲基化,启动子改变)。不涉及靶基因 DNA 本身的变化,基本是不可遗传的。

6.Knockout(敲除):

属于基因(组)编辑技术,必须是在基因组水平上造成突变,破坏基因读码框,消除整个基因的表达。一般来说,在受精卵水平的基因编辑变化能够稳定地遗传给下一代。敲低与敲除二者最明显的区别是基因组DNA序列是否发生变化。

四、NCBI序列样本

1.mRNA(messenger RNA):

信使RNA,是由编码区(CDS)、上游的5’非编码区和下游3’非编码区组成,真核生物mRNA的5’端带有7-甲基鸟苷-三磷酸帽子结构,3’端有多腺苷酸尾巴。但NCBI中mRNA序列实际上是cDNA序列,即经过反转录得到的与RNA序列互补的DNA序列,一般不包括3’多腺苷酸尾巴。 2.

一个cDNA序列被称为一个转录子,第一个碱基所在的位置为转录起始位点(TSS),cDNA都是由外显子组成,但编码蛋白质的外显子只有一个,即CDS(coding sequence),这段序列也就是一个ORF区,也就是这个cDNA的ORF序列。 3.

下面以大鼠CTGF基因为例子,小写字母是转录子前后200bp启动子相关序列,大写字母表示的是cDNA序列,也就是转录子,其中蓝色标记的部分为CDS序列,湖蓝色的为转录起始位点,即TSS,加粗带下划线的为“起始密码子”

agtgtgccagctttttcagacggaggaatgtggagtgtcaaggggtcaggatcaatccggtgtgagttgatgaggcaggaaggtggggaggaatgcgaggaatgtccctgtttgtgtaggactccattcagttctttggcgagccggccgcccggagcgtataaaagccagcgccacccgcccagtctcacacagctcttCTCTCCAAGAAGACTCAGCCAGACCCACTCCAGCTCCGACCCTAGGAGACCGACCTCCTCCAGACGGCAGCAGCCCCAGCCCAGTGGACAACCCCAGGAGCCACCACCTGGAGCGTCCGGACACCAACCTCCGCCCCGAGACCGAGTCCAGGCTCCGGCCGCGCCCCTCGTCGCCTCTGCACCCCGCTGTGCGTCCTCCTGCCGCGCCCCGACCATGCTCGCCTCCGTCGCGGGTCCCGTTAGCCTCGCCTTGGTGCTCCTCCTCTGCACCCGGCCTGCCACCGGCCAGGACTGCAGCGCGCAGTGTCAGTGCGCAGCTGAAGCGGCGCCGCGCTGCCCCGCCGGCGTGAGCCTGGTGCTGGACGGCTGCGGCTGCTGCCGCGTCTGCGCCAAGCAGCTGGGAGAACTGTGCACGGAGCGTGATCCCTGCGACCCACACAAGGGTCTCTTCTGCGACTTCGGCTCCCCCGCCAACCGCAAGATTGGCGTGTGCACTGCCAAAGATGGTGCACCCTGTGTCTTCGGTGGGTCCGTGTACCGCAGCGGCGAGTCCTTCCAAAGCAGTTGCAAATACCAGTGCACTTGCCTGGATGGGGCCGTGGGCTGTGTGCCCCTGTGCAGCATGGACGTGCGCCTGCCCAGCCCTGACTGCCCCTTCCCGAGAAGGGTCAAGCTGCCCGGGAAATGCTGTGAGGAGTGGGTGTGTGATGAGCCCAAGGACCGCACAGTGGTTGGCCCTGCCCTAGCTGCCTACCGACTGGAAGACACATTTGGCCCTGACCCAACTATGATGCGAGCCAACTGCCTGGTCCAGACCACAGAGTGGAGCGCCTGTTCTAAGACCTGTGGGATGGGCATCTCCACCCGGGTTACCAATGACAATACCTTCTGCAGGCTGGAGAAGCAGAGTCGTCTCTGCATGGTCAGGCCCTGTGAAGCTGACCTAGAGGAAAACATTAAGGTAAATAAATACTCTGCCCCCAGACACTCATTTTCACAGAATGACAGGAAAGAGAACCAGAGCTGGCTGTCTCGCCGCCCTTCTTATTATAGGCCTGTTGTCTCCAGAAATATCTAACCATGGAGCTGTCTGGCTAGAATGAGAGATGCTGTAACAGCAGCTGCCAGTTTTCCACTACAAAATTCCCCGGGGTGTTAGTTAATACGAGACACTCCAAACGAAGCCATGGCTATTTTTGGAAAACTGGCGAATGAAACTCCCAGTCTCTCTCCCCTCAGAATATAAACACAAGTCAGATGACATAGGGCTAGTCTACAGAGGGTTGAGGAAGGCCACTCCCGTTGTAGTAATTGCGGTGTCTCTTCTCGTCTTCCCTTAGAAGGGCAAAAAGTGCATCCGGACGCCTAAAATTGCCAAGCCTGTCAAGTTTGAGCTTTCTGGCTGCACCAGTGTGAAGACCTACCGGGCTAAGTTCTGTGGGGTGTGCACGGACGGCCGCTGCTGCACACCGCACAGAACCACCACACTGCCGGTGGAGTTCAAGTGCCCCGATGGCGAGATCATGAAAAAGAACATGATGTTCATCAAGACCTGTGCCTGCCATTACAACTGTCCCGGGGACAATGACATCTTTGAGTCCTTGTACTACAGGAAGATGTATGGAGACATGGCGTAAAGCCAGGGAGTAAGGGACACGAACTCATTTAGACTATAACTTGAACTGAGTTACATCTCATTTTCTTCTGTAAAAAAACAAAAAGGATTACAGTAGCACATTAATTTAAATCTGGGTTCCTAACTGCTGTGGGAGAAAACACCCCACCGAAGTGAGAACCGTGTGTCATTGTCATGCAAATAGCCTGTCAATCTCAGACACTGGTTTCGAGACAGTTTAGACTTGACAGTTGTTCACTAGCGCACAGTGACAGAACGCACACTAAGGTGAGCCTCCTGGAAGAGTGGAGATGCCAGGAGAAAGACAGGTACTAGCTGAGGTCATTTTAAAAGCAGCGATATGCCTACTTTTTGGAGTGTGACAGGGGAGGGACATTATAGCTTGCTTGCAGACAGACCTGCTCTAGCAAGAGCTGGGTGTGTGTCCTCCACTCGGTGAGGCTGAAGCCAGCTATTCTTTCAGTAAGAACAGCAGTTTCAGCGCTGACATTCTGATTCCAGTGACACTGGTCGGGAGTCAGAACCTTGTCTATTAGACTGGACAGCTTGTGGCAAGTGAATTTGCCGGTAACAAGCCAGATTTTTATGGATCTTGTAAATATTGTGGATAAATATATATATTTGTACAGTTATCTAAGTTAATTTAAAGACGTTTGTGCCTATTGTTCTTGTTTTAAGTGCTTTTGGAATTTTTAAACTGATAGCCTCAAACTCCAAACACCATCGATAGGACATAAAGCTTGTCTGTGATTCAAAACAAAGGAGATACTGCAGTGGAAACTGTAACCTGAGTGACTGTCTGTCAGAACATATGGTACGTAGACGGTAAAGCAATGGATCAGAAGTCAGATTTCTAGTAGGAAATGTAAAATCACTGTTGGCGAACAAATGGCCTTTATTAAGAAATGGCTTGCTCAGGGTAACTGGTCAGATTTCCACGAGGAAGTGTTTGCTGCTTCTTTGACTATGACTGGTTTGGGAGGCAGTTTATTTGTTGAGAGTGTGACCAAAAGTTACATGTTTGCACCTTTCTAGTTGAAAATAAAGTATATATATTTTTTATATGaaaggcttggctgctcattcttgtaaactttccttgggtttccctgggtgtaagcaggaagtttatatttatcttaaggtaattcactaagatgtttacaaacaactttgatgtgcatgagtcacatgaaatcaatagaattttgcataagcatcccttacaccggaccaagtagacatgagcatcaattatctacatgg

搜索更多关于: 基因相关名词解释级NCBI序列案例 的文档
基因相关名词解释级NCBI序列案例.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c4u1qi45dyz4n7xz5eecp3x5if1klmb00azo_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top