3361 aaattgtgat gtggtgattg gcatcattaa caacacagtg tatgatcctc tgcagcctga 3421 gctggactcc ttcaaggaag agctggacaa gtacttcaag aatcatacat ccccagatgt 3481 ggatctgggc gacatttccg gcattaacgc ttctgtggtg aacattcaga aggaaattga 3541 ccgcctgaat gaagtggcta agaatctgaa tgaatccctg attgacctgc aggaactggg 3601 caagtatgag cagtatatta agtggccttg gtatgtgtgg ctgggcttca ttgctggact 3661 gattgccatc gtgatggtga caatcctgct gtgttgcatg acctcctgtt gcagttgcct 3721 gaagggcgct tgctcttgtg gatcttgctg caagtttgat gaggatgact ctgagccagt 3781 gctgaagggc gtgaagctgc attacacagg gcccggcggc gactacaagg acgatgacga 3841 caagtgatag atcgatgcat ggatccgttt aaaccgagct ccagctttgt tccctta The spike protein of SARS-Corona Virus在SWISS-PROT蛋白质序列:
The spike protein of SARS-Corona Virus在PDB蛋白质结构序列:
(3)文献信息的查找与管理 有效地使用NCBI PubMed提供的各种主要功能,查询并下载相关课题或研究方向的论文文摘与文献全文。
查询Influenza A Viruses分子进化研究方向的文章。
5
(3)NCBI数据库简介: Nucleotide
该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。这三个组织联合组成国际核苷酸序列数据库协作体,每天交换各自数据库中的新增序列记录实现数据共享。其中的序列数据也通过与基因组序列数据库(GSDB)合作获取;专利序列数据通过与美国专利与商标局、国际专利局合作获取。 Genome
即基因组数据库,提供了多种基因组、完全染色体、Contiged序列图谱以及一体化基因物理图谱。 Structure
即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(Protein Data Bank)获得。NCBI已经将结构数据交叉链接到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez获得分子的分子结构间相互作用的图像。 Taxonomy
即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。 PopSet
包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。 Entrez
功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。 NCBI数据库检索
6
NCBI数据库的检索方法很简单,在检索框中输入检索词,检索词间默认逻辑关系为AND,检索规则基本同PubMed。可以通过下拉菜单选择记录的显示格式,通常选择GenBank Report格式或FASTA Report格式。当选择GenBank Report格式后,屏幕显示较完整的基因记录,其内容包括:基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、 核酸编号(NID )、关键词(Keywords)、 来源(Source)、组织分类(Organism)、参考文献(Reference)、 著者(Author)、题目(Title)、期刊Journal)、Medline存取号(Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。而FASTA Report格式仅包括检出序列的简要特征描述。 OMIM
孟德尔遗传学(OMIM)数据库是人类基因和基因疾病的目录数据库。该数据库包括原文信息、图片和参考信息,同时还可以链接到Entrez系统MEDLINE数据库中相关文献和序列信息。主页如图3所示。 BLAST相似性检索
BLAST(Basic Local Alignment Search Tool)是用于序列相似性检索的一个重要数据库,是区分基因和基因特征的工具。该软件能在15秒内完成整个DNA数据库的序列检索。BLAST记录的相关度有明确的统计学解释,以便更容易地将相关记录与随机的数据库记录相区分。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。
BLAST 主页提供了几种BLAST检索软件。其中BLAST2.0是一种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST 和PSI-BLAST两种软件的新功能。Gapped BLAST 允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。
三.实验要求:
(1)以其中的一个信息中心网站为例,列举其中的主要资源(数据库、网上分析、生物计算、数据下载等)。
(2)能够解释给定序列或基因组数据的含义。 (3)检索文献的技巧和效率。
7
实验二 序列多重比对及进化分析
一. 实验目的:
1. 学习序列比对工具BLAST以及ClustalW等的使用,能够对序列数据进行初步的分析。
2. 掌握基于DNA序列和蛋白质序列构建系统进化树的常用方法和常用工具。
二. 实验内容:
1. 在GeneBank数据库中,检索10条轮状病毒(Homo sapiens, Rotavirus)VP7基因的DNA序列,并使用CLUSTALW软件对序列进行多重序列比对;
检索结果详见电子稿附件:VP7.txt文件
8
相关推荐: