5️⃣ 蛋白质序列基本和特征信息分析(1) :蛋白质序列基本信息分析(氨基酸组成,理化性质,亲疏水等)...

[序列比对和序列特征分析总目录](https://www.jianshu.com/p/878f2b2495ae

蛋白质是生命功能的执行者,一切生命活动都与蛋白质有关。
我们知道,蛋白质结构分为一级结构和空间结构,而空间结构包含二级三级和四级结构,空间结构是蛋白质功能的关键。而一级结构又决定空间结构,也就是说空间结构的信息蕴藏在一级结构中。
一级结构指的是蛋白质中氨基酸的排列顺序,和DNA一级结构一致。
也就是说蛋白质发挥什么功能,基本在一级结构中就确定了。


对蛋白质序列进行基本信息分析可以帮助了解蛋白质的基本信息。这主要有分子量,等电点pI,氨基酸组成,亲疏水性质等的分析。

5.1 强大的ExPASy(Expert Protein Analysis System)

ExPASy提供一系列的蛋白质厉害性质的工具,包含的蛋白分析工具十分全面。瑞士生物信息学研究院进行维护,和前述的EBI和PIR联合组成了UniProt数据库。

注意:网站声明tools页面不再进行更新,但链接依然生效。


7976641-3d3e51cec1ada4bf.png
ExPASy

5.1.1 未知的蛋白质氨基酸组成分析AACompIdent

该工具通过将未知的氨基酸组成百分比与Uniprot数据库中的蛋白质理论氨基酸组成百分比进行匹配,从而对未知蛋白质进行鉴定识别


7976641-3bf30efe80407464.png
AACompIdent
7976641-2f3ded06ab7a7dd2.png
image.png

结果之一如下


7976641-4645809ff5c27991.png
image.png

说明,邮件会有三张表格分别解释如下

  • 1 第一张表,包含的蛋白质基于特定物种分类,但不考虑pI和分子量限制
  • 2 第二张表,包含不考虑物种,pI和分子量限制的全部蛋白质
  • 3 第三张表同时既基于特定物种,又考虑pI和分子量。
    每张表的解释,Rank越靠前的,Score越低,分越低代表最优匹配。如果score为0表示,输入的未知蛋白的组成与数据库中的序列完全符合。

5.1.2氨基酸的理化性质分析

包括氨基酸组成,pI,MW,消光系数,亲/疏水性
工具:ProParam

7976641-3715f321060935c5.png

提交的格式可以是Swissprot的记录号也可以是氨基酸序列,输入一段TIGD1序列,提交,结果如下
7976641-9dbf37bde281ab44.png

7976641-eae416ae6ce50484.png

部分结果解释

  • 消光系数: 表示蛋白质对某波长的吸收能力。Protparam不考虑蛋白质二级和三级结构的情况下,根据氨基酸组成来估算消光系数。准确的需要实验获得。
  • 体内半衰期:蛋白质在细胞内合成后,含量消失一半所需要的时间,用来衡量蛋白质的稳定性。Protparam可以预测蛋白质在人,酵母和大肠杆菌中的体内半衰期,可以作为其他物种内的参考。
  • 不稳定系数:作文蛋白质在体外测试中稳定性的参考值。40以下,提示稳定性好,大于40提示蛋白质可能不稳定。
  • 脂肪指数:蛋白质中脂肪族侧链氨基酸(Ala,Val,Leu,Ile)含量的相对值,可以作为球状蛋白质热稳定性增加的一个有利因素。
  • 蛋白质的总平均亲水性:预测蛋白质中所有氨基酸的亲水性值总和初一氨基酸残基数量得到。

5.1.3 蛋白质的亲疏水性分析

疏水性氨基酸具有相互聚合隐藏到蛋白质分子内部的趋势,这种力称为疏水作用力,维持蛋白质三级结构的主要作用力。因为氨基酸的亲疏水性是构成蛋白质折叠的主要驱动力之一,因此蛋白质亲水性分布可以反映蛋白质的折叠情况。 蛋白质总体折叠结构是亲水基团向外,疏水基团向内,并在跨膜区形成高疏水值区域,据此可以测定蛋白质的跨膜螺旋等二级结构的位置。

工具ProtScale

7976641-a902ab26fe127a9a.png
image.png

结果如下

7976641-468fa463536d7fa6.png

结果说明

  • 纵坐标Score,大于0表示疏水性,小于0表示亲水性。

猜你喜欢

转载自blog.csdn.net/weixin_34265814/article/details/86937140