第一范文网 - 专业文章范例文档资料分享平台

深兰科技-AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到何种段位?(上篇)

来源:用户分享 时间:2025/7/30 11:44:19 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

深兰科技|AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到

何种段位?(上篇)

2018年12月,谷歌(Google)旗下DeepMind团队的新成果——人工智能系统AlphaFold,首次参加Critical Assessment of Protein Structure Prediction(CASP,全球蛋白质结构预测竞赛)就获得了冠军。CASP相当于蛋白质结构预测界的世界杯,已经举办到了第13届。该赛事从1994年开始,每两年一届。这里笔者拟从蛋白质结构特点出发, 探讨 “第一版AlphaFold”可能达到的“段位”。 全文将分上下篇 两次推送

今天首先围绕蛋白质的结构特点进行阐述。 蛋白质的结构特点

地球分子生物学和分子遗传学的常识告诉我们 :遗传信息被储存在DNA分子里,特定蛋白质或者多肽链的遗传信息通过转录形成信使(mRNA),然后在核糖核蛋白体内按照mRNA携带的遗传信息被表达成为蛋白质。刚被合成出来的蛋白质只有一级结构。以后在伴侣蛋白质(Chaperone Protein)的帮助下(在本文中这一点非常重要)逐渐形成蛋白质的高级结构(Protein Higher Structure), 包括蛋白质的二级、三级和四级结构。 蛋白质的一级结构(Primary Structure)。

蛋白质或者多肽链由氨基酸构成,这些氨基酸 “一字排开” 就形成了蛋白质的一级结构。常见的氨基酸只有20种,缩写的符号有单字母方式和三字母方式两种,从数学的角度也可以把他们理解成一串三字母或者单字母的字符串。

△一段三字母缩写方式显示的简单的蛋白质一级结构

20种氨基酸的结构符合一个通式,如下图所示,中间的碳原子称为Cα碳原子,表示它处在α位;左边连了一个氨基-NH2,称为N端;右边连了一个羧基-COOH,称为C端。20种不同氨基酸的差别就在于Cα上连接的侧链基团R。20种氨基酸连接的方式为脱水缩合,即一个氨基酸的羧基-COOH和另一个氨基酸的氨基-NH2反应,丢掉一个H2O,形成一个肽键-CO-NH-。丢掉了羧基和氨基的氨基酸被称为氨基酸残基。

◆蛋白质二级结构

⊙蛋白质二级结构(Protein Secondary Structure)

是指在一级结构的基础上,肽链进行盘旋、折叠等变换,形成一种局部的三维结构,这种局部的三维结构通常由氢键支撑。细分的话,蛋白质的二级结构总共有8种,包括转角、无规则卷曲等。有些文献会把8种结构粗分为α螺旋(α-Helix)、β折叠(β-Sheet,或者β-Strand )、转角(Turn)和无规则卷曲(Random Coil)四种结构(请见下图和三级结构中的图示)。

当然,具体的细节很多,比如:形成β折叠的两股链都是从N到C(或从C到N),则称为平行排列,否则是反平行排列。每股β折叠都有一个大箭头表示其方向。

☉蛋白质的超二级结构(Proteinsuper-Secondary Structure)

是指二级结构里有特定结构和功能的区域,根据功能和结构的完整性,又分为结构域(Domain)和基序(Motif)。

△上图显示结构域

△上图显示基序

◆蛋白质的三级结构(Protein Tertiary Structure)

简单理解,三级结构就是把多个二级结构拼接到一起,折叠成一个完整的蛋白质三维结构,一般是由一条多肽链构成的。如下图所示。维持蛋白质三级结构的力比较多样,除了氢键之外,还有二硫键、金属键等。

深兰科技-AI再胜人类!初探AlphaFold预测蛋白质结构的性能达到何种段位?(上篇).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c0lin62nbhr3pebe0io3703gjy5zcvb00lr6_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top