ecm细胞外基质蛋白组学 一级质谱ms1,二级质谱ms2 wj

质谱中一级质谱ms1,二级质谱ms2的区别和作用,如下:

区别:

1、显示目标不同。

一级质谱主要是给出目标物的分子量,GC-MS一级谱图可以定性分析,LCMS只能用于简单的分子量测定。一级质谱有的时候受仪器的分辨率影响,给出的质荷比不能准确定性,比如相同分子量的不同分子,在仪器分辨率不够足够高的时候很难区分。

二级质谱可以看出目标物的部分碎片,可以对目标物的结构进行分析。一定程度上可以降低噪音,提高信噪比,从而提高灵敏度,从而也可以节省前处理步骤,可以更好地提高结果准确度,避免假阳性或者假阴性的结果。LCMS/MS完全可以用于定性分析。

2、等级不同。

一级质谱为一级,二级质谱为二级。

作用:一级质谱检测所有带电离子的质荷比和强度,形成一级谱图。一级质谱中的信号为母离子肽段信号。二级质谱按照一定方式选择母离子肽段,将其进一步解离,分析所形成的子离子的质荷比和强度。

1.蛋白质组数据分析,数据库如何选择?

答:

a) 常见的公共库有Uniprot、NCBI、和Ensembl。一般来说模式物种如人、小鼠、斑马鱼等,可以选择蛋白注释信息较为全面的Swissprot;大鼠使用Ensembl数据库;其他常见物种推荐用Uniprot,如果不是常见物种,可以选择数据库量较大的NCBI公共库。

b) 对于在Uniprot上数据库注释蛋白条目不多的物种,可以根据物种的科属种适当放大,以获得更多的蛋白组信息。

c) 需提前提供样本物种的拉丁文名,我们在数据库中搜索对应物种的拉丁名称。如果蛋白条目数目或查库结果仍不能满足需求,可再适当放大。

d) 对于数据库注释信息少,或非常见物种的,也可以选择用转录组数据库翻译后的蛋白库对质谱结果进行查库注释。

技术咨询:

研究方向、样本类型、服务咨询等​jinshuju.net/f/rsQzQ9正在上传…重新上传取消

2.为什么蛋白搜库结果用NCBI 比用Uniprot要较多一些?为什么一些在NCBI中搜到的在Uniprot里面搜不到?

答: NCBI中蛋白库的信息任何一个研究者都能提交,因此NCBI中搜录的蛋白质信息较丰富,但是很多蛋白的信息是没有经过验证或人工校验就直接提交到NCBI蛋白库中的,会有很多冗余的蛋白信息(例如,同一个蛋白会因为不同的人提交而具有不同的登录号及很多重复的相关的信息);Uniprot中的蛋白信息远没有NCBI中蛋白库的信息多,但Uniprot中的蛋白信息大多数都是经过验证或人工校验的。两个数据库都是可用的,具体还是需要看物种;如果本身是模式物种,那么选择未注释信息较多的NCBI数据库就没有那么必要了;而相对于研究较少的或比较冷门的物种,这类物种的蛋白已知注释信息本身就很少,那么选择NCBI数据库则可以相应地提高蛋白的鉴定数量。

3.做IP时,出现了很多的内参蛋白(如Actin/Tubulin等),这是什么原因?

答: 内参蛋白在组织和细胞中的含量相对较高,是很容易非特异性结合到磁珠上的,只有它们在实验组中明显比对照组中多很多的情况下才认为它是可能的互作蛋白。

4.什么是KEGG数据库?

答: KEGG全称是Kyoto Encyclopedia of Genes and Genomes,对生物学高级功能和生物系统(如细胞、生物和生态系统)进行了注释,从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。

网址链接:https://www.kegg.jp/kegg/

5.为什么KEGG通路结果中出现太多与本物种无关的通路信息?

答: 很多蛋白不仅仅是在某特定物种中存在的,KEGG网站上收录的蛋白通路信息虽然可以设置物种,但是非物种特异性的蛋白还是会涉及其他通路,这部分不符合研究背景的KEGG通路可以后期人为的剔除再去重新做富集分析即可。

6.多肽组学有肽段水平的KEGG和GO分析吗?

答: 没有。目前是用对应的蛋白质来做KEGG和GO注释的。

7.蛋白质查库软件有哪些?

答: 常见的蛋白质查库软件有:Mascot,Maxquant,Proteome Discoverer

a)普通的蛋白质定性分析可以根据需求选择查库软件,Mascot一般筛选标准较为宽松,想要尽可能多的获得蛋白质定性信息进行初步的筛选,可以选择用Mascot进行搜库。

b)普通的标记定量蛋白质组学一般使用Proteome Discoverer;修饰蛋白质组学和非标蛋白质组学可以选用Maxquant或者Proteome Discoverer。

8.什么是质谱结果中的母离子和子离子?

答: 以蛋白样本为例,通常采用的分析步骤是将蛋白酶解为肽段,再用质谱对肽段进行上机分析,这些肽段在进入质量分析器之前会被带上电荷,因为质谱只能检测带电荷的物质,这些带电荷的肽段在一级质谱中被检测时,就是母离子。如果要进一步确证序列,就会把肽段碎裂成更短的序列,这些更短的序列进一步被第二个质量分析器检测,即子离子。

9.在蛋白中10个响应值代表着10个肽段吗?每一个肽段对应一种蛋白吗?

答: 默认选择强度最大的10-20个峰进行二级质谱分析(MS2),每个母离子可以理解为一组肽段离子,每个肽段可能对应到一个蛋白也可能对应多个蛋白,具体取决于蛋白序列同源性。

10.为什么通过Elisa或Western Blot能够检测到的蛋白在质谱中并没有检测到?

答: 一般复杂样本中蛋白种类非常多,质谱检测并不能将所有蛋白质全部鉴定到,有些丰度含量较低的蛋白在质谱结果中不一定能够完整体现;Elisa/WB相比与质谱来说灵敏度不同,前者具有放大效应,抗体会对目标蛋白有一个富集效应,所以只要选对抗体,感兴趣的蛋白基本都会被检测到;而质谱结果中,如果目标蛋白丰度较低,在组学中未检测到也是正常的,质谱检测的后期验证建议用PRM。

11.有时候检测后做WB验证,发现趋势相反,有哪些原因呢?

答: 有一些是和蛋白的修饰状态有关。例如某种生理/病理现象并不和蛋白分子的表达值高低存在关联,而是修饰后的表达有关。另外在信号通路里,可能存在于信号上游,没有抓取到。另外还需要看下蛋白对应的肽段质量情况,肽段质量不高的话,也有可能是定量不准确造成的。

12.经验证目标蛋白质存在特定修饰,为什么质谱鉴定未检测到该修饰?

答: 修饰蛋白质一般属于低丰度的蛋白质,有可能未被检测到;该修饰位点所在片段酶切后产生的肽段可能过小或者过大,不利于质谱检测;这种情况可以更换不同的酶进行酶切,可预先根据酶切位点进行序列分析;如果质谱检测到该位点所在的肽段,但却未检测到修饰,可能是因为该位点修饰水平太低,不利于被检测到。这种情况可以通过其他方法提高目标蛋白质的含量尤其是发生修饰的蛋白质的含量,进一步对修饰肽段进行富集,才有希望通过质谱检测到。

13.什么是Motif分析?

答: Motif Analysis(基序分析)就是指对蛋白质结构进行分析,可找出新发现的蛋白质可能具有的结构域,并由此推测其功能。一般用于修饰蛋白质组学;用来预测修饰位点。

14.为什么我的蛋白鉴定结果偏少?

答:

a) 样本本身的蛋白量较少,如果SDS-PAGE结果显示条带比较少且很淡,则是样本本身的原因导致的;

b) 数据库不完整,如石斑鱼来源样品,这种情况下通常会将数据库向上推2-3个级别,查询更大的数据库。同时不常见物种可能数据库信息很少,需要搜近缘物种的库,这种也会导致蛋白质鉴定结果偏少;

c) 样品中含有高丰度蛋白未去除,也会影响质谱鉴定结果。

15.查库参数中设置最大允许漏切的数目2是什么意思呢?

答: 蛋白经胰酶酶切后,可能有些酶切位点并没有被切开。分析时一般采用最大2个漏切位点。

16.肽段A和肽段B中如果只是相差几个氨基酸,都是对应同一个蛋白,这种情况是不是酶解不充分?

答: 蛋白质酶解过程中,可能因为理论酶切位点发生修饰等情况,导致蛋白酶漏切的情况出现。因此,为了保证存在漏切位点的肽段在数据库检索过程中也能匹配到,检索参数会设置最大漏切位点数为2(报告参数中体现为miss cleavage 2)。所以在肽段列表中会出现两种肽段序列相似,某一种肽段存在K或者R的漏切位点的情况。这种情况属于质谱检测的正常现象。

17.参数检验和非参数检验的区别?

答: 参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。例如两样本比较的t检验是判断两样本分别代表的总体的均值是否具有差异,属于参数检验。而两样本比较的秩和检验(Wilcoxcon检验及Mann-Whitney检验)是判断两样本分别代表的总体的位置有无差别(即两总体的变量值有无倾向性的未知偏离),属于非参数检验。

18.可不可以将之前的蛋白组结果和这次的蛋白组放在一起分析?能不能使用公共数据库里的蛋白组数据和我的蛋白组结果一起分析?

答: 两次实验条件如果不一致,例如使用的技术、仪器、参数不同,得到的数据不建议放在一起分析。

19.在蛋白质定量数据表中,Unique Peptide是不是越多越好,Peptide=1的蛋白质定量结果是否不太准确,最好将其排除?

答: 首先Unique Peptide在不同情况下有两种不同的含义:一种情况指用于定性的Unique Peptide;第二种情况则是指用于定量的Unique Peptide。简单来说,肯定是检测到的蛋白质的(定性)Unique Peptide越多,蛋白质可信度越高。随着现在质谱仪精度和分辨率的提高,对应高精度质谱仪产生的数据,像MCP或者JPR这类蛋白质组学领域最好的杂志,也明确表示认可Unique Peptide=1且对应图FDR谱质量较高的数据,只是根据杂志的不同要求需要提交不同格式的图谱数据。另一方面,对于定量Unique Peptide的数量,文章一般都没有要求。对于只有一段肽定量一个蛋白质的情况,蛋白质定量结果的准确性和可靠性会相对较低。在实验中,都可以通过设置生物学重复来消除这部分影响。

20.蛋白组原始数据提交用什么网站?需要提交什么数据类型?

答: 目前,投稿主流的蛋白质组学杂志时,要求或者推荐采用该平台上传发表文章的质谱数据。PX Submission tool(下载地址:http://www.proteomexchange.org/submission)。需要提供的原始数据有:Raw文件(原始质谱文件);msf文件(查库结果原始文件);Prot.xml文件(蛋白查库结果);Pep.xml文件(肽段查库结果);Database 文件(查库所用数据库);mgf(即peaklist文件,非必要)。

21.PCA结果如何解读?

答: 主成分分析(PCA)分析是一种非监督的数据分析方法,它将原本鉴定到的所有代谢物重新线性组合,形成一组新的综合变量,同时根据所分析的问题从中选取几个综合变量,使它们尽可能多地反映原有变量的信息,从而达到降维的目的。同时,对蛋白进行主成分分析,还能从总体上反映样本组间和组内的变异度。采用PCA的方法,观察所有样本之间的总体分布趋势,找出可能存在的离散点。两两组或者多组比较的PCA图,主要看组内样本是否聚集,组间样本是否能够分离。一般情况下,组内样本聚集在相同区间,组间样本分布在不同区间。

22.PCA模型参数意义是什么?

答: PCA模型参数可以不考虑,主要看PCA图,QC的PCA图主要看QC样品是否聚集在一起,两组或者多组比较的PCA图,主要看组内的点分布是否集中,组间是否分离。

23.为什么有的差异蛋白没有KEGG ID或者没有KEGG通路?

答: 因为有些蛋白和代谢物在KEGG数据库中并没有注释和收录,这部分蛋白结果是没有KEGG注释信息的。

24.如何在KEGG通路图中查找目标蛋白?

答: 在蛋白质组学研究中,查库数据库通常采用UniProt、NCBI等数据库的信息,这部分数据库有可能存在与KEGG显示名称不一致的情况,因此在通路图中快速定位感兴趣的目标蛋白可能具有一定的困难。一般我们在NCBI数据库中找到对应蛋白的GENE名称或者蛋白名称在KEGG对应条目中去搜索,示例如下:

搜索结果中会按物种显示,选择符合实验研究背景的物种(最好是确认的物种条目,如果没有,则选择近缘物种)

则可以获得该蛋白的基本信息:

如果想知道该蛋白涉及到的KEGG通路,则在开始的条目选择KEGG Pathway再进行搜索。

还可以通过点击Pathway所对应的各个通路具体来看通路信息,所以KEGG是功能非常强大的一个开源的数据库网站。

25.如何对差异蛋白进行相互作用分析?

答: String数据库是一个搜索已知蛋白质之间和预测蛋白质之间相互作用的数据库,该数据库可应用于14094个物种,包含6760万种蛋白质和200亿种蛋白质之间的相互作用。它除了包含有实验数据、从PubMed摘要中文本挖掘的结果和综合其他数据库数据外,还有利用生物信息学的方法预测的结果。

目前String数据库覆盖的物种较多,相互作用信息收录较多,网址如下:https://string-db.org/

搜索页面也比较友好,示例如下:

我们可以尝试输入几个比较常见的蛋白,输入示例如下,选择我们对应输入的条目,如果是蛋白序列则选择Sequence,如果是名称,需要对应选择蛋白名称。

得到以下结果:

图中我们可以看到Rac1 和Mapk1是有互作关系的,但这两个蛋白与Rab21则都没有互作关系。蛋白互作图本身显示结果比较直观,在基础研究中非常实用。

26.常用的蛋白酶及其对应的酶切位点有哪些?

酶切位点
胰蛋白酶Trypsin Arg-|-Xaa, Lys-|-Xaa
谷氨酰基内切酶Glutamate Carboxypeptidase Xaa-|-Glu(Xaa通常为 Asp 或 Glu)
胰凝乳蛋白酶Chymotrypsin Tyr-|-Xaa、Trp-|-Xaa、Phe-|-Xaa、 Leu-|-Xaa、Met-|-Xaa

27.怎么判断酶解是否充分?

答: 绝大部分质谱鉴定到的蛋白所对应的肽段长度分布在 8-35 个氨基酸残基之间,说明样本制备达到标准,胰蛋白酶实现充分酶切。如果有较多长链肽段,可能是由于没有充分酶切导致的。

28.从哪里可以看到我做的蛋白组检测搜的库是什么?

答: 分析报告中会列出本次使用数据库。例如:Uniprot_Human_20394_202004,数据库+物种+序列数+版本号。

29.为什么同样的样本其他人鉴定的数目比我多?

答: 鉴定到的蛋白数目与样本的处理方式、样本选取部位、实验所使用的方法以及搜库时所使用的的数据库都有关系,所以出来的结果各不相同。

30.蛋白组与其他组学进行联合分析会提供哪些内容?

答: 蛋白组与除微生物组外的组学进行联合分析会提供统计学上的关联分析与通路上的关联分析结果,与微生物组进行关联分析时仅提供统计学上的关联分析。

猜你喜欢

转载自blog.csdn.net/qq_52813185/article/details/129556922
WJ
ms1
今日推荐