推荐厂家
暂无
暂无
质谱与蛋白质组学蛋白质组学对一个细胞或组织所表达的蛋白质进行的系统分析,而质谱是它的关键性分析工具。在过去的两年中,标准蛋白质组技术中的进展增进了更高水平自动化和敏感性的蛋白质识别技术。另外,新的技术促成了鉴定蛋白质功能相关特性的里程碑性的进展,包括它们的定量和在蛋白质复合物中复杂情况。缩写2DE two-dimensional gel electrophoresis双向凝胶电泳CID collision-induced dissociation碰撞诱导的解离ESI electrospray ionization电喷雾离子化FT-ICR Fourier-transform ion cyclotron resonance傅里叶-变换离子回旋加速器共振ICAT isotope-coded affinity tagsIEF isoelectric focusing等电聚焦MALDI matrix-assisted laser desorption ionization基质辅助的激光解析离子化Q-TOF quadrupole-TOFRP reversed phase反向TOF time-of-flight飞行时间简介蛋白质组学的核心组成是系统识别一个细胞或组织中表达的每一个蛋白质,以及确定每个蛋白质的突出特征(比如,丰度、修饰状态以及在多蛋白质复合体中的复杂状态)。这些分析的技术包括分离蛋白质和肽的分离科学、识别和定量分析物的分析科学和数据管理和分析的生物信息学。它的初步工具包括使用IEF(等电点聚焦)/SDS-PAGE凝胶的高分辨率的双向凝胶电泳(2DE),结合质谱和数据库搜索来分离、识别和定量在一个复合样本中存在的个体蛋白质,最终识别被分离的蛋白质。一个常用的方法用在Fig1中用图解说明。此技术以及由此而来的变化(综述见[1])已经被用来识别和分类在复杂样本中存在的大量蛋白质,并在蛋白质组数据库中呈现它们,该过程我们这里称之为"描述蛋白质组学"比如,Shevchenko等[2]从2D凝胶上系统地鉴定了150个蛋白质。数目庞大的这样的数据库现在可以找到。同样的技术现在已经被作为普遍的发现工具来动态检测一个细胞或组织对外来或内部干扰反应而在蛋白质组中的改变。因为检测动态改变需要精确定量每个被检测成分,我们使用"定量蛋白质组学"来定义。在此报告中,我们总结了自1999年1月至2000年4月来报道的与蛋白质组学和质谱相关的最重要的进展。在核心质谱技术中的进展已经导致2DE为基础的蛋白质组学技术的进一步改进。它们同时又促进了传统凝胶为基础的方法的替代方法,诸如引入以同位素稀释理论为基础的精确蛋白质定量技术和蛋白质复合物的系统分析。蛋白质组分析的MS技术进展在此部分,我们总结了在MS设备、它们的控制和操作中的进展,以及比较质谱数据和序列数据库识别蛋白质所用的搜索工具的进展。随着新型质谱仪的引入,蛋白质组学研究现存类型的质谱仪性能已经显著改进了。在此综述期间最普遍使用的仪器是可以分为两类:单一阶段的质谱仪和串联质谱为基础的系统。单一阶段的质谱仪,最显著的是基质辅助的激光解吸电离(MALDI)飞行时间(TOF)仪器,被用于无数通过肽质谱图谱技术大规模蛋白质识别的项目中。此方法在鉴别表达自小一些的和完全测序的基因组的蛋白质特别成功[3,4]。串联质谱仪器诸如triple quadrpole、离子捕获(ion-trap)和近来引进的混合quadrupole飞行时间(Q-TOF)被常规应用于[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS或用电喷雾电离(ESI)来生成肽片段离子谱,以便通过搜寻序列数据库进行蛋白质鉴定。使用仪器控制程序来自动选择肽离子进行碰撞诱导的解离(CID)(数据依赖CID)的不断增多是这些MS/MS仪器的一个明显的趋势。一些新的构造的具有高潜能的质谱仪被引入到蛋白质组学研究中产生深刻影响。两个研究组近来一个MALDI离子源和一个混合Q-TOF耦联了起来[5,6]。Q-TOF提供的质量准确性和敏感性提升了数据库搜寻结果并同时使它成为MS/MS从头测序的当然仪器选择。MALDI Q-TOF构造提供了激动人心的机会进行自动化和高通量应用以及在一个样品盘上存档样品进行日后研究的可能。Medzihradszky等[7]描述了一个不同的混合仪器称之为MALDI TOF TOF。此设备享有许多MALDI Q-TOF的优点,另外能够进行高能量CID和非常快速的扫描速率。傅里叶-变换离子回旋加速器共振(FT-ICR)质谱对于蛋白质组学来说相对陌生。这些设备具有非常高的敏感性和分辨率,质量精确性可以达到1ppm。这些特征被用来在一次分析中测量和定量几百种蛋白质的完整的分子质量[8]。Goodlett等[9]表明FT-MS测量的一个肽的准确质量以及可以容易获得的限制因素能够通过序列数据库搜索被用来识别蛋白质。蛋白质组学如果没有软件工具来进行质谱数据和序列数据库的关联将变得几无可能。现存的数据库搜索程序已经变得越来越成熟和可以(从网络)可获得。另外,引入了新的算法。主要相关程序是Sequest[10],MASCOT[11],PeptedeSearch[12],PROWL[13]和Protein Prospector[14]。在它们中间,Sequest使用CID谱设置了蛋白质识别的实验室标准(benchmark),因为它与边界MS/MS数据工作得最好,并高度可信,可以从整个[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS实验中自动分析数据,并不需要任何使用者的破译工作。在所提的程序中,然而,只有Sequest不能在网络上搜索。MASCOT是一个新的、快速、网络可进入和多功能的程序,具有进行肽指纹分析、用部分破译或未破译的CID谱进行数据库搜索的功能。
PS1利用基质辅助激光解吸电离-飞行时间(MALDI-TOF)技术来表征生物分子。样品溶于固定的底物中形成晶体,用激光脉冲使其离子化,离子被加速后通过飞行管时分离,所有离子均可被检测。系统包括三个组成部件:样品点样制备工作站(SymBiot 1)、生物质谱工作站(Voyager-DE PRO)和自动化分析软件(AutoMS-Fit)。SymBiot1 是一个自动样品处理系统,支持亚微升级微量点样,具有快速省时、重现性好的特点;Voyager-DE PRO是为蛋白质组研究专门设计的自动飞行时间质谱分析系统,配有AB公司之专利—延迟检测技术,具有高分辨率、质荷比宽等特点;AutoMS软件可以批处理方式或实时动态方式检索Protein Prospector蛋白数据库或您指定的蛋白数据库,查询参数可以任意设定,检索结果以Microsoft Access格式分类编号及储存。 PS 1技术平台建立伊始便受到了许多蛋白质课题研究组的关注。中国科学院上海生物化学研究所戚正武院士课题组从猪肝中提取某一活性蛋白组分,该组分理化性质不清楚,天然含量十分低,并无相关文献报道。用HPLC分离以后对活性组分的成分不能确定。上海基康生物技术有限公司运用PS 1系统对HPLC分离后的活性组分作了质谱分析,仅在一个工作日内就精确确定该组分由分子量极为相近的几种蛋白质构成,分子量精确度达到10 ppm。后经HPLC再次细分(洗脱梯度增加了2.5倍),证实了质谱的结论。此活性组分曾滤过1kD分子筛,基康的质谱数据纠正了研究人员过去对该活性组分分子量的误判,为研究人员明确实验方向、优化实验步骤提供了强有力的依据。 PS1除了可以进行生物大分子的精确分子量测定,还可用于蛋白的肽指纹图谱分析(peptide mass fingerprint,PMF),提供相关生物信息学服务,并且还可以利用源后衰变(Post Source Decay,PSD)技术来获得样品的MS/MS数据,以得到一级结构信息。PSD方法通常增加了激发激光的功率,使其超过产生一般肽指纹谱图所需功率的阈值,过剩的能量使前体离子在源内离子化之后发生裂解,产生一系列碎片离子,在反射器的作用下,最终可以得到一张连续的碎片离子图谱。经特定的软件分析后,即可在数据库中检索到肽段的氨基酸序列。利用PSD分析技术,还可以对磷酸化,糖基化等翻译后修饰进行定位分析,同样也可以鉴定产生翻译后修饰肽段的蛋白质。Neville et al.(1997)将这一方法成功的用于磷酸肽的序列分析。作为重要的蛋白质鉴定手段之一,PS1的精确度可以达到10 ppm,灵敏度为fmol,分子量检测范围可达到500 kDa,每天可自动分析40-100个样品,适用于大规模“蛋白质组学”研究。
20世纪基因组学研究取得的巨大成就为蛋白质组学的发展奠定了基础。蛋白质组学是从整体水平上分析生命体、组织或细胞的蛋白质组成及其活动规律的科学,以基因表达产物为研究对象,延伸了基因组学研究深度,更深层次地揭示了生命活动规律。蛋白质组学的研究内容主要包括蛋白质表达存在方式(修饰形式)的鉴定、结构与功能分析、蛋白质定位、蛋白质差异表达以及蛋白质间相互作用分析等[1]。目前蛋白质组学研究技术主要包括:二维电泳技术、蛋白质芯片技术、质谱技术等[2]。其中,二维电泳技术是早期蛋白质组学的重要技术之一,但是由于实验步骤多,耗时长,重复性差等特点,已经逐步被新型技术所取代。蛋白质芯片技术是将多种蛋白质纯品点于芯片表面,形成蛋白质矩阵进行免疫等标记反应,主要受限于很多蛋白质无法获得纯品而不能用于芯片制备。质谱技术由于灵敏度高、特异性强、分析范围宽等优点逐渐成为蛋白质组学的主要研究手段,可以对特定生命过程中的功能性蛋白质分子进行定性和定量检测,因此在基础科研和临床研究中得到了广泛的应用[3,4]。一、基于质谱的蛋白质组学技术1.基于质谱的蛋白质组学定性技术:蛋白质定性鉴定的基本原理在于:蛋白质组的基本序列已经通过基因组学信息获得,可以用来鉴定多肽的氨基酸序列,并且获得多肽与蛋白质的对应关系[1],即质谱提供的多肽碎片数据可以与蛋白质数据库自动匹配来确定多肽序列与蛋白质归属。基本技术策略分为:(1)自上而下(Top–down)策略[5],即完整蛋白质在质谱中进行分析,可以提供完整蛋白质的质量数,但是由于质谱仪受到质量分析范围的限制,此方法在常规实验室不易实现。(2)自下而上(Bottom–up)策略[6],即蛋白质被蛋白酶水解成多肽,然后对多肽进行质谱分析和碎裂。基于这条策略的大致步骤为:蛋白质样品首先经过酶解降解为多肽,然后对多肽进行色谱–质谱分离与鉴定,最后通过搜索引擎(MASCOT:http://www.matrixscience.com/server.html, SEQUEST:http://fields.scripps.edu/sequest等)在公共蛋白质组学数据库(SWISS–PORT: http://web.expasy.org/groups/swissprot, NCBI:http://www.ncbi.nlm.nih.gov/pubmed等)中自动完成质谱数据的解析,确定多肽序列与蛋白质种类。该技术灵敏度高,特异性好,仪器自动化程度高,可以鉴定出生物样品中成千上万种蛋白质,被认为是大规模、高通量蛋白质定性检测的首选方法。2.基于质谱的蛋白质组学相对定量技术:对于大多数生命科学和医学研究来说,仅完成样品中蛋白质组的定性研究是远远不够的,还需要对蛋白质组进行定量分析。由于组学的研究对象是多个蛋白质,单次检测很难实现所有蛋白质的绝对定量,因此蛋白质组学定量多为相对定量检测。蛋白质组学定量的质谱技术包括谱图计数、质谱峰强度定量、同位素定量技术等。其中使用同位素作为内标定量的方法是目前质谱定量的最佳手段,即对整体蛋白质组进行同位素标记,并使用每一种天然蛋白质与同位素蛋白质的比值进行相对定量分析。主要分为细胞层面标记和蛋白质层面标记两种技术路线:(1)细胞层面标记的细胞培养氨基酸稳定同位素标记(stable isotope labeling with amino acids in cell culture,SILAC)方法[7]:即在两种细胞样品中分别加入轻重同位素标记的培养基,经过传代培养后,两种细胞样品中的全部蛋白质中分别嵌合了轻重同位素,可以在质谱上根据同位素的不同质荷比直接判断样品来源并进行定量比对。(2)蛋白质层面标记:使用含有同位素的小分子与样品全部蛋白质直接标记,如同位素标记相对和绝对定量技术(isobaric tags for relative and absolute quantification,iTRAQ)[8]、同位素编码亲和标记(isotope–coded affinity tag,iCAT) [9]、18O标记[10]等方法,此类方法使用带有稳定同位素的小分子与特定氨基酸侧链反应,使得多个样品可以分别连接含有不同同位素个数(多至8个)的小分子,从而产生一级数据相同但是二级数据不同的质谱谱图,通过二级谱图强度比对进行多个样品的定量分析。3.基于质谱的目标蛋白质绝对定量技术:质谱技术对目标蛋白质的绝对定量检测主要通过质谱多反应监控技术与同位素多肽内标技术联用来实现[11]。该方法首先选定目标蛋白质的一个或多个多肽,合成序列相同但含有稳定同位素的多肽作为内标,定量加入样品中,通过监测特定多肽及其同位素多肽的质谱峰强度进行比对和计算获得目标蛋白质的定量值。质谱多反应监控技术通过进行母离子筛选与子离子筛选等二次选择过程,筛选出目标蛋白质,而非目标蛋白质由于无法通过筛选达到检测器,极大降低了噪音干扰。因此,此方法针对性强,本底噪音低,是目前质谱技术中定量能力最好的一种,可以控制变异系数小于15%,检测限低至纳克每毫升,适合血液、组织等临床样品的定量检测[11]。二、质谱技术发现肿瘤蛋白质标志物质谱技术作为一项强有力的研究工具在科学研究中发挥着巨大的作用,特别在肿瘤相关研究中,目前已经获得美国食品药品监督管理局(Food and Drug Administration,FDA)批准的肿瘤标志物包括多种蛋白质前列腺特异性抗原(prostate–specific antigen, PSA), 癌胚抗原(carcinoembryonic antigen CEA), 人类表皮生长因子受体2(human epidermal growth factor receptor 2,Her–2), 人绒毛膜促性腺激素(human chorionic gonadotropin, HCG), 糖类抗原CA125等,均揭示了蛋白质与肿瘤发生发展密切相关。这些已有成果极大促进了质谱技术在肿瘤蛋白质标志物研究中的应用,并取得了标志性进展。例如:美国约翰霍普金斯大学的Chan课题组发现了新型卵巢癌蛋白质标志物,他们使用表面增强激光解析电离质谱技术(surface enhanced laser desorption and ionization time–of–flight mass spectrometry, SELDI–TOF MS)技术对503个妇女的血清进行了蛋白质组学的分析[12],在随后的大量临床验证中最终确定CA125、β2微球蛋白,转铁蛋白,甲状腺运载蛋白和载脂蛋白A1的联合检测可以作为卵巢癌的新型临床诊断指标。2009年9月该试剂盒OVA1(商品名称:http://ova–1.com)获得了美国FDA的认证,进入临床使用,被认为是国际肿瘤蛋白质标志物研究的重要标志性成果。同时,肿瘤仍然是国际上致死率最高的疾病之一,缺乏早期检测技术和有效治疗方案,临床中还存在着大量问题需要解决,新型标志物的研发迫在眉睫。由于肿瘤蛋白质标志物研究的难度大,风险高,因此近十年来仅有几例试剂盒获得了美国FDA批准,进入临床使用。大量标志物研究还停留在论文研究水平,其中临床问题、研究思路和技术方案的选择直接关系到研究的成功与否。1.临床问题选择:在肿瘤蛋白质标志物研究中,临床问题的选择是研究核心。在肿瘤研究中,需要解决的临床问题往往包括肿瘤早期检测、肿瘤分期检测、治疗方案与药物选择、疗效评估等多个方面。研究者需要根据不同肿瘤的临床情况,具体分析并凝练不同肿瘤的主要临床问题。例如,对于病程发展快、五年存活率低、没有有效手术或化疗手段的肿瘤,早期诊断是研究重点,如胰腺癌、卵巢癌、肺癌等;对于病程发展慢、手术效果明显的肿瘤,肿瘤的愈后与复发是需要关注的问题,如前列腺癌、肠癌等;还有一些肿瘤有特殊的检测需求,如乳腺癌虽然有临床有效的雌激素受体(estrogen receptor,ER),孕激素受体(progesterone receptor,PR),HER2等基因标志物,可以进行药物靶点治疗,但是三阴性乳腺癌的检测还缺乏有效的标志物与治疗方案。因此,在肿瘤蛋白质标志物研究实验开展之前,明确临床问题,并以此确定临床样品入组标准,是研究成功的核心基础。2.研究思路设计:不同于基础科学实验,临床实验需要在大量样本中进行实验结果的验证,因此肿瘤蛋白质标志物研究往往包括新型标志物发现和验证两部分。标志物发现实验是在疾病组和对照组之间进行蛋白质组学分析,鉴定样本中的未知蛋白质组并进行相对定量比较,分析数据选择出在两组样本中差异最大的一个或几个蛋白质作为新型标志物的候选物。随后,标志物验证实验在大量未知样本中进行蛋白质候选物的定量检测,使用发现实验中建立的区分标准进行判读,计算检测灵敏性(sensitivity)和特异性(specificity)。有效的蛋白质标志物研究往往需要发现与验证的两步设计思路来相互保证。3.技术方案选择:根据蛋白质标志物研究的两步设计思路,发现实验中使用基于质谱的蛋白质组学定性技术与相对定量技术对样本中的大量未知蛋白质进行分析,获得标志物候选物名单。验证实验中根据已有名单,进行目标蛋白质(非蛋白质组学)的精确定量检测。这几种质谱技术的配合使用,可以满足不同实验情况和目的,最终实现新型蛋白质标志物的成功研发。三、展望质谱技术是现阶段蛋白质组学研究的核心技术,具有灵敏度高、特异性强、分析通量大等优势,特别是其与同位素内标的联合使用,大大提高了质谱定量能力,因此在多种肿瘤标志物研究中取得了突破性进展并被广泛应用。目前,大量肿瘤蛋白质标志物候选物已经通过使用质谱技术被从血液、组织、体液中筛选出来,预计在完成大规模临床验证后可以作为新型标志物在临床使用,促进肿瘤检测水平的发展。同时值得注意的是,质谱技术还不具备进行蛋白质组的绝对定量能力。相对于免疫等传统蛋白质检测技术,仪器昂贵,操作复杂,自动化程度低,这些因素决定了质谱目前适用于蛋白质的临床研究,但不适用于蛋白质的临床检验,这是质谱技术面临的重要挑战之一。参考文献[1]何华勤. 简明蛋白质组学[M]. 北京:中国林业出版社, 2011:1,76,85-95,119,125-138.[2]RuediA, MatthiasM. Mass spectrometry-based proteomics[J]. Nature, 2003, 422(13):198-207.[3]甄艳, 施季森. 质谱技术在蛋白质组学研究中的应用[J]. 南京林业大学学报:自然科学版, 2011, 35(1):103-108.[4]孙瑞祥, 付岩, 李德泉,等. 基于质谱技术的计算蛋白质组学研究[J]. 中国科学E辑信息科学, 2006, 36(2):222-234.[5]WhiteleggeJ,HalgandF,SoudaP, et al. Top-down mass spectrometry of integral membrane proteins [J]. Expert Review Proteomics, 2006, 3(6):585-596.[6]ChaitBT. Mass spectrometry:bottom-up or top-down? [J]. Science, 2006, 314(5796):65-66.[7]TranDT, AdhikariJ, FitzgeraldMC. StableIsotope Labeling with Amino Acids in Cell Culture (SILAC)-based strategy for proteome-wide thermodynamic analysis of protein-ligand binding interactions [J]. Mol Cell Proteomics, 2014,13(7):1800-1813.[8]DytfeldD, KandarpaM, StrahlerJR, et al. Proteomic Profiling of Multiple Myeloma (MM) Cells Using iTRAQ and Label-Free Quantitative Proteomics for the Prediction of Complete or near Complete Response (CR/nCR) In Frontline Treatment with Lenalidomide, Bortezomib, and Dexamethasone [J]. Blood, 2010, 116(21):271-272.[9]García-SantamarinaS, BoronatS, DomènechA, et al. Monitoring in vivo reversible cysteine oxidation in proteins using ICAT and mass spectrometry [J]. Nat Protoc,2014,9(5):1131-1145.[10]MirzaSP, GreeneAS, OlivierM. 18O labeling over a coffee break:a rapid strategy for quantitative proteomics [J]. J Proteome Res, 2008,7(7):3042-3048.[11]曹冬, 张养军, 钱小红. 基于生物质谱的蛋白质组学绝对定量方法研究进展[J]. 质谱学报, 2008, 29(3):185-190.[12]ZhangZ, BastRC, YuY,et al. Three biomarkers identified from serum proteomic analysis for the detection of early stage ovarian cancer[J]. Cancer Res,2004,64(16), 5882-5890.