推荐厂家
暂无
暂无
2003年人类基因组精细图绘制完成,是人类科学史上一个里程碑式的事件。后基因组时代的研究重点自然落在了蛋白质头上。为啥?因为中心法则告诉我们,基因的产物——蛋白质,是生命活动的最终执行者。与基因组类比,研究生物体内全套蛋白质的科学,就是蛋白质组学。基因组计划完成的同年,人类蛋白质组计划启动,令人激动的是,2014年人类蛋白质组的草图也完成了。而蛋白质组学能够飞速发展的最大功臣非质谱莫属。质谱的应用范围非常广泛,但这里只讨论蛋白质组学中的质谱。简单地说,质谱法(mass spectrometry)就是对肽段离子的重量(质荷比,m/z)进行测量的分析方法。样品经质谱仪(mass spectrometer)检测得到质谱图(mass spectrum),通过对质谱图的分析就可以对样品中的蛋白进行鉴定、定量。亲,图1的这种典型的蛋白质组学流程都很熟悉吧。蛋白首先都要被特异性的酶(通常为Trypsin)切割为肽段,再进行后续分析,这在蛋白质组学中被称为“自下而上”的研究策略(Bottom-up proteomics)。我们平时见到的质谱分析基本都是这种类型。提到蛋白质组,即会联想到一系列高大上的名词,iTRAQ、SWATH、SILAC、Shotgun、Label-free等等。很多概念容易弄混淆,下面我们就来理理清楚。图1. 典型的蛋白质组学流程大体上,质谱研究蛋白主要是鉴定和定量。通过二级质谱图(MS2或者MS/MS)进行数据库搜索匹配鉴定蛋白。通过各种标记或非标记的手段对不同样品中的蛋白进行比较就是定量。蛋白定量比较是质谱最重要的用途,图2是对定量方法的一个简单总结。非标定量(Label-free)不需要标记,不同样品分别处理、分别进质谱检测;优点是处理简单、无需标记、价格便宜、可以比较很多组样品,缺点是对操作步骤、LC、质谱稳定性要求严格。SILAC是在细胞培养基中加入稳定同位素标记的氨基酸,在代谢水平标记蛋白,一级质谱图进行定量,可以做到三组样品混合后进行比较,定量准确,但是不能标记组织样本,养细胞成本也较贵。双甲基化标记是通过化学反应的办法在肽段水平进行标记,一级质谱定量,也可以三组对比,标记试剂都比较便宜,而且可以标记任何来源的样品。iTRAQ和TMT是商品化的试剂盒,肽段水平标记,二级质谱定量;分别可以做到最多8组和10组样品间蛋白质组的比较。图2. 质谱定量方法以上这几个是一家的,还有几个名词是属于另外一家,比如Shotgun (DDA)、SWATH/DIA、SRM (MRM)、MRMHR/PRM。质谱进行数据采集的方式大致分为三种:鸟枪法(Shotgun)、选择反应监控(SRM)和全景式的SWATH/DIA。下面对照图3再来简单介绍一下。图3. 质谱扫描方式DDA、IDA、Shotgun和鸟枪法说的是相同的东西,意思是质谱在每个循环的中从一级里挑选丰度高的TopN个肽段去打碎做二级扫描,得到的结果通过与已知数据库中的理论蛋白进行匹配。DDA简单有效,分析流程比较成熟,也是目前质谱分析的主流方式。DDA也有其固有的缺陷,即具有一定的随机性,偏向于检测丰度较高的肽段,而抑制了低丰度肽段的检测。靶向策略被称为质谱领域的Western blot。质谱只去采集目标肽段大小的离子信息,因而提高了灵敏度和特异性。这种方法用来研究感兴趣的特定蛋白,定量准确,但是通量很有限。SWATH/DIA这种全景式的数据采集方式在最近几年突然火了起来,被认为在不远的未来可能会取代DDA的主流位置。该方法采取的策略是将扫描范围内的所有肽段按照质荷比分为若干个窗口,再对每个窗口里所有的肽段一起打碎,采二级,数据分析时通过抽提蛋白的子离子信息进行定量。SWATH/DIA解决了DDA中随机性选择肽段的缺陷,所以重复性更好,定量的准确性基本达到了SRM的水平,而且可以实现大规模定量。借用听来的一个比喻来说明:DDA就像机关枪扫射,数量多、体积大的目标命中的概率要大一些。靶向扫描(SRM或PRM)就像精准狙击,排除干扰,目标明确,每一枪直指目标,但是难以大规模消灭敌人。SWATH/DIA就是地毯式轰炸,只要暴露在我方攻击范围内的敌人,不管三七二十一,全部炸完。图4. 定量方法与采集方式结合如果将上述的定量方法(图2)和质谱数据采集方式(图3)结合起来,就得到了现在基于质谱的蛋白质组学研究的各种策略(图4)。再打个比方,保证吃货们一听就懂:鸡、鱼、肉、蛋、蔬菜要通过炒锅、烤箱、高压锅、微波炉等烹调之后才能变为美食,填饱肚子。同样的,各种定量方法(非标的和标记的)处理的样品,要通过质谱各种采集方式变为电脑中的数据,才能分析并从中得到蛋白的信息。本次的介绍就先到这里了,如果其中有什么问题,欢迎您批评和建议,我们会努力变得更好;如果需要跟我们进行技术交流和讨论,欢迎大家联系武汉金开瑞。后续我们还会继续推出对质谱技术各方面进行解析的文章,敬请期待。ReferencesA draft map of the human proteome. Nature 509: 575–581 (2014)Mass-spectrometry-based draft of the human proteome. Nature 509: 582–587 (2014)A review: Annu. Rev. Biochem. 80: 273–99 (2011)SILAC: Molecular & Cellular Proteomics 1: 376-386 (2002)iTRAQ: Molecular & Cellular Proteomics 343: 91–99 (2010)SRM: Nature Methods 9: 555–566 (2012)SWATH: Molecular & Cellular Proteomics 11: 1–17 (2012)
质谱与蛋白质组学蛋白质组学对一个细胞或组织所表达的蛋白质进行的系统分析,而质谱是它的关键性分析工具。在过去的两年中,标准蛋白质组技术中的进展增进了更高水平自动化和敏感性的蛋白质识别技术。另外,新的技术促成了鉴定蛋白质功能相关特性的里程碑性的进展,包括它们的定量和在蛋白质复合物中复杂情况。缩写2DE two-dimensional gel electrophoresis双向凝胶电泳CID collision-induced dissociation碰撞诱导的解离ESI electrospray ionization电喷雾离子化FT-ICR Fourier-transform ion cyclotron resonance傅里叶-变换离子回旋加速器共振ICAT isotope-coded affinity tagsIEF isoelectric focusing等电聚焦MALDI matrix-assisted laser desorption ionization基质辅助的激光解析离子化Q-TOF quadrupole-TOFRP reversed phase反向TOF time-of-flight飞行时间简介蛋白质组学的核心组成是系统识别一个细胞或组织中表达的每一个蛋白质,以及确定每个蛋白质的突出特征(比如,丰度、修饰状态以及在多蛋白质复合体中的复杂状态)。这些分析的技术包括分离蛋白质和肽的分离科学、识别和定量分析物的分析科学和数据管理和分析的生物信息学。它的初步工具包括使用IEF(等电点聚焦)/SDS-PAGE凝胶的高分辨率的双向凝胶电泳(2DE),结合质谱和数据库搜索来分离、识别和定量在一个复合样本中存在的个体蛋白质,最终识别被分离的蛋白质。一个常用的方法用在Fig1中用图解说明。此技术以及由此而来的变化(综述见[1])已经被用来识别和分类在复杂样本中存在的大量蛋白质,并在蛋白质组数据库中呈现它们,该过程我们这里称之为"描述蛋白质组学"比如,Shevchenko等[2]从2D凝胶上系统地鉴定了150个蛋白质。数目庞大的这样的数据库现在可以找到。同样的技术现在已经被作为普遍的发现工具来动态检测一个细胞或组织对外来或内部干扰反应而在蛋白质组中的改变。因为检测动态改变需要精确定量每个被检测成分,我们使用"定量蛋白质组学"来定义。在此报告中,我们总结了自1999年1月至2000年4月来报道的与蛋白质组学和质谱相关的最重要的进展。在核心质谱技术中的进展已经导致2DE为基础的蛋白质组学技术的进一步改进。它们同时又促进了传统凝胶为基础的方法的替代方法,诸如引入以同位素稀释理论为基础的精确蛋白质定量技术和蛋白质复合物的系统分析。蛋白质组分析的MS技术进展在此部分,我们总结了在MS设备、它们的控制和操作中的进展,以及比较质谱数据和序列数据库识别蛋白质所用的搜索工具的进展。随着新型质谱仪的引入,蛋白质组学研究现存类型的质谱仪性能已经显著改进了。在此综述期间最普遍使用的仪器是可以分为两类:单一阶段的质谱仪和串联质谱为基础的系统。单一阶段的质谱仪,最显著的是基质辅助的激光解吸电离(MALDI)飞行时间(TOF)仪器,被用于无数通过肽质谱图谱技术大规模蛋白质识别的项目中。此方法在鉴别表达自小一些的和完全测序的基因组的蛋白质特别成功[3,4]。串联质谱仪器诸如triple quadrpole、离子捕获(ion-trap)和近来引进的混合quadrupole飞行时间(Q-TOF)被常规应用于[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS或用电喷雾电离(ESI)来生成肽片段离子谱,以便通过搜寻序列数据库进行蛋白质鉴定。使用仪器控制程序来自动选择肽离子进行碰撞诱导的解离(CID)(数据依赖CID)的不断增多是这些MS/MS仪器的一个明显的趋势。一些新的构造的具有高潜能的质谱仪被引入到蛋白质组学研究中产生深刻影响。两个研究组近来一个MALDI离子源和一个混合Q-TOF耦联了起来[5,6]。Q-TOF提供的质量准确性和敏感性提升了数据库搜寻结果并同时使它成为MS/MS从头测序的当然仪器选择。MALDI Q-TOF构造提供了激动人心的机会进行自动化和高通量应用以及在一个样品盘上存档样品进行日后研究的可能。Medzihradszky等[7]描述了一个不同的混合仪器称之为MALDI TOF TOF。此设备享有许多MALDI Q-TOF的优点,另外能够进行高能量CID和非常快速的扫描速率。傅里叶-变换离子回旋加速器共振(FT-ICR)质谱对于蛋白质组学来说相对陌生。这些设备具有非常高的敏感性和分辨率,质量精确性可以达到1ppm。这些特征被用来在一次分析中测量和定量几百种蛋白质的完整的分子质量[8]。Goodlett等[9]表明FT-MS测量的一个肽的准确质量以及可以容易获得的限制因素能够通过序列数据库搜索被用来识别蛋白质。蛋白质组学如果没有软件工具来进行质谱数据和序列数据库的关联将变得几无可能。现存的数据库搜索程序已经变得越来越成熟和可以(从网络)可获得。另外,引入了新的算法。主要相关程序是Sequest[10],MASCOT[11],PeptedeSearch[12],PROWL[13]和Protein Prospector[14]。在它们中间,Sequest使用CID谱设置了蛋白质识别的实验室标准(benchmark),因为它与边界MS/MS数据工作得最好,并高度可信,可以从整个[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS实验中自动分析数据,并不需要任何使用者的破译工作。在所提的程序中,然而,只有Sequest不能在网络上搜索。MASCOT是一个新的、快速、网络可进入和多功能的程序,具有进行肽指纹分析、用部分破译或未破译的CID谱进行数据库搜索的功能。
蛋白质组学研究的一般工具与方法随着人类基因组计划取得巨大的成功和许多物种基因组测序的完成,仅仅靠基因组的序列来试图阐明生命现象是远远不够的,因此,研究重心已经开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,生命科学已实质性地跨入了后基因组时代。 尽管现在已经有多个物种的基因组被测序,但这些基因组中通常有一半以上基因的功能是未知的。目前功能基因组研究中所采用的策略,如微阵列法(microarray)(Wodicka et al., 1997)、基因芯片(gene chips)(Ramsay et al., 1998)、基因表达序列分析(SAGE)(Velculescu et al., 1995)等,都是从细胞中mRNA的角度来考虑的。但事实上,从DNA、mRNA到蛋白质存在三个层次的调控,mRNA自身也存在着贮存、转运和降解等问题,从mRNA角度考虑,实际上仅包括了转录水平调控,并不能全面代表蛋白质表达水平。实验也证明,组织中mRNA丰度与蛋白质丰度的相关性并不好,尤其对于低丰度蛋白质来说,相关性更差。蛋白质复杂的翻译后修饰,蛋白质的亚细胞定位或迁移,蛋白质-蛋白质相互作用则几乎无法从mRNA水平来判断(曾嵘,夏其昌,2002)。新生肽链合成后存在多种加工、修饰过程,蛋白质间也存在类似于mRNA分子内的剪切、拼接,研究证明基本元件“intein”广泛存在于蛋白质中(Perler et al., 1997)。基因与其编码产物蛋白的线性对应关系只存在于新生肽链而不是最终的功能蛋白质中。 蛋白质是生理功能的执行者和生命现象的直接体现者,对蛋白质结构和功能的研究将直接阐明生命在生理或病理条件下的变化机制;蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用及蛋白质构象等问题,仍依赖于直接对蛋白质的研究来解决。因此要对生命的复杂活动有全面和深入的认识,必然要在整体、动态、网络的水平上对蛋白质进行研究(钱小红,贺福初,2003)。 蛋白质组学研究中常用的技术体系 方法学上,二维凝胶电泳-质谱仍然是目前最流行和可靠的技术平台(Rabilloud et al., 2000)。其一般过程是:细胞或组织样品——样品制备——二维凝胶电泳(2D-PAGE)分离蛋白质——计算机辅助分析2D-PAGE图象——对感兴趣的蛋白质进行酶解——质谱分析——数据库检索——蛋白质鉴定——分析蛋白质在细胞与组织中的表达情况。 2-D PAGE 样品制备 2D-PAGE 的操作流程基本上实现了程序化。但是,样品制备是一个非常关键与复杂的过程。成功的2D-PAGE取决于对样品中蛋白质有效的抽提和它的溶解性。与核酸不同,目前没有一种通用的方法适用于所有的蛋白质,来源不同的蛋白质都受到自身蛋白质制备方法的挑战。 正确的样品制备方法从收集样品开始时就要防止样品的裂解和被蛋白水解酶降解(Rabilloud et al., 2000)。要尽可能溶解更多的蛋白,并且在2D-PAGE过程中保持它的溶解性,阻止蛋白质的人为修饰。在样品制备过程中,各个实验室也通过实验建立了更为可行的方法。目前通过建立分步提取方法可以有效地提取出更多的蛋白质(兰彦等,2001)。另一种对蛋白质采用预分离的方法称为“多间隔电解法(multi-compartment-electrolyser)”,采用这种方法后,分辨率和胶的质量均明显改善(Herbert et al., 2000)。 但是,由于生物样品的多样性和复杂性,目前所采用的样品制备方法具有局限性。其它物质对蛋白质样品制备存在干扰。核酸通过与蛋白质结合,增加样品黏度而干扰等点聚焦(IEF)分离的效果。当然,通过实验探索,采取一些措施可以减轻它的干扰。例如,在样品制备过程中加入非特异性的核酸酶或RNase与DNase的混合物,在等电聚焦时将每个胶条的电流限制在50mA以内通常可以消除其影响。脂类物质的影响可以通过利用有机溶剂的方法将其去除,但是这常常会导致蛋白质的不可逆沉淀。除了蛋白质的降解之外,糖基化是蛋白质的最重要的人工修饰,样品中的尿素在这一过程中起着非常重要的作用。样品中的尿素在降解的过程中会形成能够与蛋白质的氨基反应的氰酸盐,这种结果会导致蛋白质带有更多的正电荷。所以,在2D-PAGE中要用新鲜的尿素溶液,在等电聚焦过程中要控制温度不能太高(Beranova-Giorgianni, 2003)。但是,目前还没有一种简单有效的方法来去除样品中的多糖。 样品分离和分析 样品制备完成后运用IEF和SDS-PAGE电泳对它进行分离,常采用银染和考马斯亮兰染色即可观察到具有许多蛋白质斑点的凝胶图像。等电聚焦电泳与SDS-PAGE的具体操作步骤已经实现了程序化,均有详细操作流程参考,但是由于样品的不同,不同样品的具体条件还需要试验探索。第二相SDS-PAGE运行结束,染色完毕后,利用计算机软件对凝胶图像进行分析,如PD-QUEST软件,LIPS,HERMES,GEMINI等,对凝胶图像上的蛋白质斑点进行匹配,对图像进行数字化处理等分析(贾宇峰等,2001),对感兴趣的蛋白质采用质谱分析。 低丰度蛋白质的检测 低丰度蛋白在蛋白质组学研究中常常是人们非常感兴趣的,因为细胞或组织中的一些生物活性物质,如细胞分泌的一些活性物质,受体等表达量都非常低。按照一般电泳的上样量,这些小分子是根本看不到的,但如果单纯地增加上样量,细胞或组织中的大量表达的蛋白就会将其覆盖,而且上样量过大也会影响电泳结果。所以对这些低丰度的样品可以进行富集,富集的方法可以通过层析,如亲和层析,离子交换层析等方法,还可以通过利用样品等电点性质等方法将pH范围相近的蛋白质富集(Santoni et al., 2000; Beranova-Giorgianni, 2003)。