立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 321|回复: 5

[分享] 质谱仪测氨基酸序列打碎多肽链后到底是怎么测序的,不应该是除了端位,剩下的都无法判断吗?

[复制链接]
发表于 2025-3-12 13:16 | 显示全部楼层 |阅读模式
回复

使用道具 举报

发表于 2025-3-12 13:17 | 显示全部楼层
碰巧了,我是蛋白组学质谱分析软件在中国的技术,多肽序列测定甚至说在多肽测序基础上蛋白质水平的从头测序,都是可以靠串联质谱来实现的。对于二级谱的解析主要有三种方法:
1. 根据已知的序列数据库的理论序列,在理论酶解产生理论肽段的情况下,根据所设定的肽段碎裂方式,得到理论的碎片谱峰列表,在该search space中找到和你这张谱最能够匹配的肽段,通常我们叫做database search。数据库中主要是已知的编码区的大部分序列。
2. 当样品需要对其中的已知肽段进行快速鉴定以实现样品检测的目的时,可以通过谱图库搜索的方式获得pre-defined peptide的鉴定。一般是公开的谱图库或者自己构建的质谱二级谱图库。
3. de novo sequencing: 在不依赖数据库的情况下,针对一张二级谱,直接解出最合适匹配这张谱图的一条肽段,解决数据库没有的肽段,或者非编码区可变剪接产生的肽段,基于de novo的序列标签,可以通过与reference database进行同源搜索,得到突变信息。
以下图肽段碎裂产生b、y离子为例,在一级质谱中,测得precursor也就是这个带电肽段分子离子的m/z,进而我们可以计算出肽段质量数,那么在二级谱中,质谱测得的就是不同的碎片离子的质量数,例如下图的b2离子-b1离子就应该是N这个氨基酸的残基质量数,简单得说,互补的b和y相加要等于一级质谱所测的母离子的质量数。




对于未知蛋白的测序,其实也是可以实现的,质谱分辨率越高,质量测得越准。具体我就不在这里展开了,关于蛋白质谱分析可以去B站看我的视频。
PEAKS Software Overview and de novo——PEAKS Studio & Online培训_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
回复 支持 反对

使用道具 举报

发表于 2025-3-12 13:18 | 显示全部楼层
补充一点。
质谱测氨基酸序列还是存在一些问题。大部分人认为的蛋白质组学测序,其实更准确叫做数据库匹配,和测序还是有很大不同。


一般多肽测序是bottom-up方法。就是先做酶解,然后把多肽在质谱中做MS和MS/MS。然后利用二级谱的序列匹配,打分判断。但是做测序,未知蛋白测序还是很难的。
原因在于,二级质谱大部分的by离子使用的是CID裂解产生的,而CID裂解会经历一个分子能量重新分配的过程,因此往往是产生一个分子中最不稳定化学键断裂,如果想达到测序的目的,原则上所有的by离子都应该产生,但实际上CID并不能保证每一个氨基酸都断裂,比如Pro就很难。另外,对于Leu和Ile来说也是无法区分,Leu和Ile基本需要靠数据库综合打分判断。所以,对于大多数基于QTOF蛋白质组学而言,“测序”更准确的是叫肽段匹配。            


而使用Orbitrap质谱的ECD裂解,可以弥补CID裂解的问题。  由于电子俘获以后发生特异性alpha裂解,会产生丰富的cz离子帮助定性。所以对于这类仪器,HCD结合ECD/ETD可能实现对肽段测序,Ile和Leu的ECD行为也有些差异。当然FTICR也可实现。
更进一步说,如果想获得一个蛋白质的氨基酸绝对序列。除了x-ray以外,NMR是可以实现读出绝对结构。HNCACB序列等一系列主链行走方法可以确定氨基酸连接方式和二级结构。但是价格和时间成本都远远高于MS。
回复 支持 反对

使用道具 举报

发表于 2025-3-12 13:18 | 显示全部楼层
问题中用了【打碎】二字,更确切的说法应该是【酶切】。以最常用的胰蛋白酶酶切为例,它在氨基酸K和R处进行酶切,所以可以根据酶切规律预测肽段的序列,从而预测其质合比。详情如下图所示:
第一步是蛋白酶切(Digestion) 成肽段。其中最常用的是胰蛋白酶,它在精氨酸(Arg)和赖氨酸(Lys)位点将蛋白酶切。酶切后的大部分肽段会按照胰蛋白酶的酶切规则变成“胰蛋白酶酶切肽段”。将蛋白质酶解后产生复杂的肽段混合物会非常复杂,因为胰蛋白酶酶切后会平均产生50条肽段。因此在蛋白质酶解之前一般采用SDS-PAGE进行预分离(Seperation),以将所有的蛋白质组分分离成子蛋白质组分来减少样品复杂性。蛋白质酶解后通常会进行肽段选择,以挑选特定属性肽段(如糖基化肽段、磷酸化肽段等等)。输出的肽段样品使用反向色谱层析法进一步分离。
第二步是将酶切肽段送入质谱仪分析。肽段从反相色谱柱出来后被离子化、气态化,之后特定的离子进入串联质谱仪(MS/MS)以生成碎片离子质谱(MS/MS spectra)。数据获取过程如下:
质谱仪扫描所有肽段离子并记录一级质谱的质荷比(m/z)和丰度。之后经选择的肽段离子(也称为母离子precursor)在质谱仪的碰撞池中裂解成更小的碎片离子。获得的二级质谱(MS/MS)是由母离子生成的所有碎片离子的质荷比和丰度。根据MS/MS质谱仪的裂解规律可以识别产生碎片离子的肽段的氨基酸序列。碎片离子的生成通常采用碰撞诱导解离技术(CID)、电子传递解离(ETD)和高能碰撞解离(HCD)。有一些更高级的质谱仪可以将碎片离子进一步碎裂,从而生成三级质谱。
质谱分析器的质量精确度和分辨率对质谱信息有一个显著的影响,从而影响接下来的肽段鉴定。质谱仪的精确度最低可以达到几百万分之一(ppm),比如LTQ-Orbitrap这种高质量精确度的仪器。而对于低质量精确度的仪器,其精确度会高达500 ppm。即使是采用高质量精确度的仪器,要获得真正的高质量精确度,还需要经过优化仪器设置、控制室内温度、计算校准等步骤。质谱仪的质量分辨率意味着可以精确确定肽段离子电荷状态的能力,高质量分辨率可以在一个较窄的质荷比范围内分辨MS/MS质谱数据,从而排除无关数据的影响。



第三步是进行肽段鉴定(Peptide identification)。而分析的关键是根据MS/MS质谱数据鉴定出对应的肽段。而肽段鉴定策略可大致分为以下四类:序列数据库搜索方法(database search approach)是通过比较实验谱图和根据蛋白质序列数据库理论酶切形成的理论谱图来鉴定肽段;谱图库搜索方法(spectral library searching)是通过直接比较实验谱图和理论谱图来鉴定肽段;而从头测序方法(de novo sequencing approach)直接从质谱数据推测肽段而无需数据库的帮助;肽序列标签法是数据库搜索方法和从头测序方法的整合,它先通过从头测序方法鉴定3-5个残基长度的短序列标签,之后再通过数据库搜索方法鉴定整个肽段。本文仅介绍主流的序列数据库搜索方法(Sequence database search approach)。如下图所示:


因为采用胰蛋白酶酶切,所以酶切后的肽段以氨基酸R结尾。该酶切肽段送入串联质谱分析后获得质谱(Acquired spectrum)。序列数据库搜索软件以实验MS/MS质谱数据与计算机模拟的理论酶切质谱数据(Theoretical spectrum)相比较。通过计算机模拟理论酶切并设置过滤参数从而得到目标序列。最重要的参数包括母离子质量误差容限、酶切类型、固定修饰、可变修饰。其他的参数包括碎片离子类型(如b离子、y离子)和碎片离子质量误差容限。搜库软件比对实验谱图和理论谱图之后将给出带有打分值的肽段谱图匹配(peptide spectra match, PSM)其打分值标识出PSM的可信度。如图中所示Best match是肽段VSTPNVSVVDLTCR,其打分值是5.6,相较于随后的打分值1.3和1.1是最高的。所以到此已经实现了这一条肽段的鉴定,将酶切后所有的肽段都鉴定之后根据酶切规律进行蛋白的组装,仍然用打分值来表征该组装蛋白可信度的高低,从而实现对蛋白的鉴定。

参考文献:
Alexey I. Nesvizhskii. A survey of computational methods and error rate estimation procedures for peptide and protein identification in shotgun proteomics. J Proteomics. 2010.
回复 支持 反对

使用道具 举报

发表于 2025-3-12 13:18 | 显示全部楼层
你理解的测序,跟你说的蛋白质测序不是一回事哦。
你理解中的蛋白质测序(实际含义是:给未知蛋白确定氨基酸序列),实际上是通过(1)X射线衍射,看原子排列,需要蛋白质单晶,或者(2)多维核磁,insolution NMR。蛋白质的数据库(PDB)基本上都是收录这两种方式获得的蛋白质序列的。当然,化学法也有测序的手段,但是非常古老,非常繁琐。
而现在的质谱用的蛋白质测序,实际上是对已知蛋白质而言的,你获得了蛋白质,但是你不知道它是数据库中哪种蛋白质。如果数据库不存在的蛋白,目前的质谱测序是无法告知你答案的。
它的原理是:每个蛋白都有自己的序列,也就意味着,蛋白打碎了,会出现一系列独特的碎片。相当于它的指纹。指纹识别你应该知道,不需要一整个指纹全部匹配上,只需要指纹的一个部分,就能确定这个指纹的归属。也就是当蛋白的碎片峰达到某个数量,就基本上可以确定蛋白的种类、具体的归属了(在质谱数据检索中,是score,也就是匹配度)。
当然,真正的蛋白测序,用的是bottom up,也就是先把蛋白切碎了,再把碎片拿去做质谱序列分析。然后再把这些信息汇总,作为它的指纹去识别。还有一张方法是top down,直接把蛋白打碎,然后收集指纹,但是这种方式数据处理非常麻烦,比较少大规模运用。在这里就不展开了。你要是有兴趣,我们可以再私下探讨。
回复 支持 反对

使用道具 举报

发表于 2025-3-12 13:18 | 显示全部楼层
通过二级质谱的谱图来推断多肽的氨基酸序列。相同质核比不同排列的多肽的准分子离子的二级质谱碎片有很大的差异。色谱跑得好,信息足够的话,很容易就能算出序列。也可以用电脑摸拟或者查数据库。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表