当前位置: 仪器信息网 > 行业主题 > >

红外蛋白质二级结构分析

仪器信息网红外蛋白质二级结构分析专题为您提供2024年最新红外蛋白质二级结构分析价格报价、厂家品牌的相关信息, 包括红外蛋白质二级结构分析参数、型号等,不管是国产,还是进口品牌的红外蛋白质二级结构分析您都可以在这里找到。 除此之外,仪器信息网还免费为您整合红外蛋白质二级结构分析相关的耗材配件、试剂标物,还有红外蛋白质二级结构分析相关的最新资讯、资料,以及红外蛋白质二级结构分析相关的解决方案。

红外蛋白质二级结构分析相关的资讯

  • 蛋白质结构分析新技术创测定速度纪录
    《自然-方法学》:蛋白质结构分析新技术创测定速度纪录  过去需几年时间完成的工作现在仅用几天即可完成  据美国物理学家组织网7月20日报道,隶属于美国能源部的劳伦斯伯克利国家实验室的科学家开发出一种利用小角度X射线散射技术测定蛋白质结构的新方法,大大提高了蛋白质结构研究分析的效率,使过去需要几年时间完成的工作仅需要几天即可完成,这将极大地促进结构基因组学的研究进程。  结构基因组学是一门研究生物中所有蛋白质结构的科学。通过对蛋白质结构的分析,可大致了解蛋白质的功能。结构基因组学重视快速、大量的蛋白质结构测定,而快速结构测定技术正是该学科研究面临的一个瓶颈问题。目前通常使用的两种测定技术,X射线晶体衍射和核磁共振质谱技术,虽然精确,但速度很慢,测定一个基因的蛋白质结构,动辄就需要几年的时间。随着新发现的蛋白质及蛋白质复合物越来越多,目前的分析速度远远不能满足研究的需要。  为解决这个瓶颈问题,劳伦斯伯克利国家实验室的科学家们借助了该实验室的先进光源(ALS)。他们运用一种称为小角度X射线散射(SAXS)的技术,对处于自然状态下(如在溶液之中)的蛋白质进行成像,其分辨率大约为10埃米(1埃米等于1/10纳米),足够用来测定蛋白质的三维结构。ASL产生的强光可以使实验所需材料减至最少,这使得该技术可以用于几乎所有生物分子的研究。  为了最大限度提高测定速度,研究小组安装了一个自动装置,可自动使用移液器吸取蛋白质样品到指定位置,以便利用X射线散射进行分析研究。他们还使用美国能源部国家能源研究科学计算机中心(NERSC)的超级计算资源进行数据分析。利用这一系统,研究小组取得了惊人的研究效率,在1个月内分析测定了火球菌的40组蛋白质结构。如果使用X射线晶体衍射技术,这可能需要花几年时间。同时,他们所获取的信息十分全面,涵盖了溶液中大部分蛋白质样本的结构信息。相比于在结构基因组学启动计划中使用核磁共振和晶体衍射技术仅能获取15%的信息量来说,这是十分巨大的进步。  高通量蛋白质结构分析有助于加快生物燃料的研究步伐,帮助解读极端微生物在恶劣环境中的繁荣之谜,更好地理解蛋白质的功能。研究小组之所以首先选择火球菌进行实验分析,就是因为它可用来生产清洁能源——氢。同时,在许多工业流程中都会出现高酸高热的环境状态,而这正是火球菌喜欢的生存环境。  但这种技术也有不足之处,追求速度会造成一种失衡,使成像质量相应打了折扣。与X射线晶体衍射成像的超高分辨率相比,小角度X射线散射成像的分辨率比较低,大约是10埃米。但这并不妨碍该技术的应用前景,因为并不是所有的研究都需要超高精度成像。对于结构基因组学研究来说,有时只要知道一种蛋白质与另一种蛋白质具有相似的结构,就可以了解其功能。而且,小角度X射线散射技术能够提供溶液中蛋白质形状、结构及构造变化等方面的精确信息,足以弥补其在成像精度方面的不足。  该研究成果刊登在7月20日《自然—方法学》杂志网络版上,美国斯克利普斯研究所和乔治亚州大学的科学家亦参与了该项研究。
  • 新型蛋白质表征仪器系统使生物治疗分析得到改观
    p style="text-indent: 2em "RedShift™ BioAnalytics公司推出了一款新型蛋白质表征平台——AQS3® PRO,这一平台结合了强大的、高度集成的自动化生物分析软件,为生物医疗行业带来了高灵敏度的光谱分析。/pp style="text-indent: 2em "用户通过这一平台可以观察浓度范围在0.1至200 mg/mL的蛋白质二级结构变化,并能进行集成性、可量化、稳定的结构检测和相似性检测,为用药的安全性和有效性提供重要支撑。它能够提供多种属性的测量,减少甚至消除了使用不同工具进行各种单一属性测量的需要。此外,AQS3pro还具有先进的自动化多样本分析功能,大大简化了生物医疗产业的分析工作流程。/pp style="text-indent: 2em "RedShift™ BioAnalytics公司的首席技术官Eugene Ma表示:“ AQS3prois是生物物理表征领域的一项重大进展——将红外光谱应用在生物医疗领域的诊断分析上。这一平台是我们内部一流研发团队与大量行业专家、学术专家倾力合作的结晶。其检测的准确性、重复性和重现性已在数百个样本中得到验证,这些样本包含有数千种尺寸量度的蛋白质。有力的数据支撑和合作伙伴的热情增强了我们对AQS3Pro的信心,我们相信这一成果具有相当大的产业化价值。”/pp style="text-indent: 2em "AQS3Pro新系统使用了RedShift™ BioAnalytics公司的微流控调制光谱学(MMS)专利技术,这一技术将针对微流体的中红外激光光谱分析与先进的信号处理相结合,对蛋白质的二级结构进行测量。它能够在0.01至200mg/mL的浓度范围内对蛋白质直接进行无需标记的测量,在生物医药研发和制造过程经常遇到的各种条件下,无需样品稀释,就可以进行样品表征。其检测是高度自动化的,其多样品检测功能、便捷化操作设置和最先进的生物分析软件进一步提升了检测流程的效率。创新而灵活的分析套件也使得光谱数据的常规分析高度自动化,其先进的检测分析工具能够方便地获得样品的结构性变化,并对这些变化的影响进行深入分析。/pp style="text-indent: 2em "“我与RedShift™ BioAnalytics一直在AQS3PRO的验证性测试中合作。”美国特拉华大学的Christopher Roberts教授说, “这一平台将MMS和红外光谱应用在蛋白质溶液的分析中,让我们能够对多种样本、多种浓度范围蛋白质的二次结构性变化,进行同时的原位量化测量。无论是对从事蛋白质基础性研究的科学家,还是负责生物产品开发的工程师,AQS3PRO都将带来极大的助益。”/p
  • 新型蛋白质结构分析手段-氢氘交换质谱技术进展
    贾伟、陈熙沃特世科技(上海)有限公司实验中心氢氘交换质谱法是一种研究蛋白质空间构象的质谱技术。它在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位及活性位点鉴定方面有着广泛的应用。随着氢氘交换质谱技术的不断发展,它正在成为结构生物学家及生物药物研发的重要手段。 氢氘交换质谱(HDX MS,hydrogen deuterium exchange mass spectrometry)是一种研究蛋白质空间构象的质谱技术。其原理是将蛋白浸入重水溶液中,蛋白的氢原子将于重水的氘原子发生交换,而且蛋白质表面与重水密切接触的氢比位于蛋白质内部的或参与氢键形成的氢的交换速率快,进而通过质谱检测确定蛋白质不同序列片段的氢氘交换速率,从而得出蛋白质空间结构信息[1]。这个过程就像将握着的拳头浸入水中,然后提出水面并张开手掌。这时,湿润的手背表明它在&ldquo 拳头&rdquo 的结构中处于外表面,而较为干燥的手心表明它是&ldquo 拳头&rdquo 的内部。除样品制备外,氢氘交换质谱法的主要过程包括:交换反应、终止反应、将蛋白快速酶切为多肽、液相分离、质谱检测、数据解析。其中交换步骤需要在多个反应时长下进行,如0s、10s、1min、10min、60min等,以绘制交换率曲线,得到准确全面的信息。氢氘交换质谱技术在蛋白质结构及其动态变化研究[1]、蛋白质相互作用位点发现[2]、蛋白表位及活性位点鉴定方面有着广泛的应用[3]。 与经典的蛋白质结构研究方法相比,如X射线晶体衍射(X-Ray Crystallography)和核磁共振(NMR. Nuclear Magnetic Resonance)等方法,氢氘交换质谱不能够提供精确的蛋白空间结构,它直接提供的主要信息包括哪些氨基酸序列位于蛋白质空间结构的表面位置(包括动态变化中的)、可能的活性位点和蛋白-蛋白相互作用位点等。但是氢氘交换质谱技术有着其他经典方法不具备的优点:首先,可以进行蛋白质结构动态变化的研究是氢氘交换质谱的一个突出优点,包括变化中的活性位点及表位;其次,氢氘交换质谱在蛋白复合体构象的研究中也具有独到的优势;此外,氢氘交换质谱还具有对样品需求量小、纯度要求相对较低、研究对象为溶液环境下的蛋白质的天然构象而非晶体中构象等优势[1,4,5]。自1991年第一篇研究论文发表起,氢氘交换质谱技术不断发展,已经成为结构生物学及质谱技术中一个非常重要的应用领域[6]。但是氢氘交换质谱实验的复杂的实现过程在一定程度上影响了其应用的广泛度。主要的难点有:1、如何避免交换后氘代肽段的回交现象;2、实验控制的高精确性和重现性要求;3、交换后造成的叠加的质谱峰如何准确分辨;4、简易高效的分析软件需求;5、以氨基酸为单位的交换位点辨析。沃特世公司自2005年起,针对以上难点不断进行攻关,推出了目前唯一商业化的全自动氢氘交换质谱系统解决方案&mdash &mdash nanoACQUITY UPLC HD-Exchange System(图1)。在全世界范围内,这套系统已经帮助科学家在包括Cell、Nature等顶级研究期刊中发表研究论文[7,8]。除科研需求外,沃特世氢氘交换质谱系统也受到众多国际领先制药公司的认可,并用于新药开发中蛋白药物活性位点及表位的研究工作中。氢氘交换实验中的回交现象将严重影响实验数据的可信度,甚至导致错误结果的产生。要避免回交需要做到两点:尽量缩短液质分析时间和保证液质分析中的温度和pH为最低回交反应系数所要求的环境。沃特世UPLC系统采用亚二纳米色谱颗粒填料,较HPLC使用的大颗粒填料,UPLC具有无与伦比的分离度。因此UPLC可以做到在不损失色谱分离效果的要求下,极大缩短液相分析时间的要求[9]。对于对温度和pH控制问题,在多年的工程学改进中,nanoACQUITY UPLC HD-Exchange System已经实现了对酶切、液相分离等步骤的全程控制[10]。 对氢氘交换质谱实验精确性和重现性的要求是其应用的第二个主要难点。在实验中一般需要采集0s、10s、1min、10min、60min、240min等多个时间点的数据。如果进行人工手动实验,很难做到对10S-10min等几个时间点的精确操作。再考虑到重复实验的需求,人工手动操作会对最终数据可信度产生影响。而且实验过程重复繁琐,将给实验人员带来非常大的工作压力。nanoACQUITY UPLC HD-Exchange System完全通过智能机械臂,精确完成交换、终止交换、进样、酶切等一系列实验过程,而且始终保证各个步骤所需不同的温度环境。这些自动化过程不但保证了实验数据的可靠性,提高了实验效率,也将科学家从繁琐的重复实验中解放出来。 氢氘交换实验的质谱数据中,随着交换时间的延长,发生了交换反应的多肽,由于质量变大,其质谱信号将逐渐向高质荷比方向移动。因此,这些质谱峰可能与哪些未发生交换反应的多肽质谱峰逐渐叠加、相互覆盖。相互叠加的质谱信号,不但影响对峰归属的判断,更会增加交换率数据的误差。因为交换率判断需要通过对发生交换的多肽进行定量,毫无疑问因叠加的而混乱的质谱数据将极大的影响对质谱峰的准确定量。这点对于单纯通过质荷比进行分析的质谱仪来说完全无能为力。但是,这个看似不可能完成的任务却被沃特世 nanoACQUITY UPLC HD-Exchange System攻克了。这是因为,不同于其它常见质谱,沃特世的SYNAPT质谱平台还具备根据离子大小及形态进行分离的功能(行波离子淌度分离)。在数据处理时,除多肽离子的质荷比信息外,还可以通过离子迁移时间(离子淌度维度参数)将不同离子区分。因此这种SYNPAT独有的被命名为HDMSE的质谱分析技术可以将因质荷比相同而重叠的多肽分离开,轻而易举地解决了质谱信号叠加的问题,得到准确的交换率数据[11,12](图2)。SYNPAT质谱平台一经推出就夺得了2007年PITTCON金奖,目前已经推出了新一代的SYNAPT G2HDMS、SYNAPT G2-S HDMS等型号,并具备ESI、MALDI等多种离子源。除氢氘交换技术外,SYNAPT质谱系统在蛋白质复合体结构研究中也是独具特色,已有多篇高质量应用文献发表[13,14,15]。 实现氢氘交换质谱技术的第四个关键点,是如何高效分析实验产生的多时间点及多次重复带来的大量数据。人工完成如此巨大的信息处理工作,将消耗科学家大量的时间。沃特世氢氘交换质谱解决方案所提供的DynamX软件可以为科学家提供简便直观的分析结果,并包含多种呈现方式。 在某些特殊研究中,要求对蛋白氢氘交换位点做到精确到氨基酸的测量,这是氢氘交换质谱研究的又一个难点。在常规的研究中采用CID(碰撞诱导解离)碎裂模式,可能导致氘原子在多肽内重排,而致使不能对发生交换的具体氨基酸进行精确定位。SYNPAT质谱提供的ETD(电子转移解离)碎裂模式可以避免氘原子重排造成的信息混乱,并具有良好的碎裂信号[16]。沃特世的nanoACQUITY UPLC HD-Exchange System为氢氘交换质谱实验提供了前所未有的简易的解决方案,强有力地推动了氢氘交换技术在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位以及活性位点鉴定方面的应用,正在成为众多结构生物学科学家和生物制药企业必不可少的工作平台。参考文献(1) John R. Engen, Analysis of Protein Conformation and Dynamics by Hydrogen/Deuterium Exchange MS. Anal. Chem. 2009,81, 7870&ndash 7875(2) Engen et al. probing protein interactions using HD exchange ms in ms of protein interactions. Edited by Downard, John Wiley & Sons, Inc. 2007, 45-61(3) Tiyanont K, Wales TE, Aste-Amezaga M, et al. Evidence for increased exposure of the Notch1 metalloprotease cleavage site upon conversion to an activated conformation. Structure. 2011, 19, 546-554(4) Heck AJ. Native mass spectrometry: a bridge between interactomics and structural biology. Nat Methods. 2008, 5, 927-933.(5) Esther van Duijn, Albert J.R. Heck. Mass spectrometric analysis of intact macromolecular chaperone complexes. Drug Discovery Today. Drug Discovery Today: Technologies Volume 3, 2006, 21-27(6) Viswanat ham Katta, Brian T. C hait, Steven Ca r r. Conformational changes in proteins probed by hydrogen-exchange electrospray-ionization mass spectrometry. Rapid Commun. Mass Spectrom. 1991, 5, 214&ndash 217(7) Chakraborty K, Chatila M, Sinha J, et al. Chaperonin-catalyzed rescue of kinetically trapped states in protein folding. Cell. 2010 Jul 9 142(1):112-22.(8) Zhang J, Adriá n FJ, Jahnke W, et al. Targeting Bcr-Abl by combining allosteric with AT P-binding-site inhibitors. Nature. 2010,463, 501-506(9) Wu Y, Engen JR, Hobbins WB. Ultra performance liquid chromatography (UPLC) further improves hydrogen/deuterium exchange mass spectrometry. J Am Soc Mass Spectrom. 2006 , 17, 163-167(10) Wales T E, Fadgen KE, Gerhardt GC, Engen JR. High-speedand high-resolution UPLC separation at zero degrees Celsius. Anal Chem. 2008, 80, 6815-6820(11) Giles K, Pringle SD, Worthington KR, et al. Applications of a travelling wave-based radio-frequency-only stacked ring ion guide. Rapid Commun Mass Spectrom. 2004, 18, 2401-2414(12) Olivova P, C hen W, C ha kra borty AB, Gebler JC. Determination of N-glycosylation sites and site heterogeneity in a monoclonal antibody by electrospray quadrupole ion-mobility time-offlight mass spectrometry. Rapid Commun Mass Spectrom. 2008, 22,29-40(13) Ruotolo BT, Benesch JL, Sandercock AM, et al. Ion mobilitymass spectrometry analysis of large protein complexes. Nat Protoc.2008, 3, 1139-52.(14) Uetrecht C, Barbu IM, Shoemaker GK, et al. Interrogating viral capsid assembly with ion mobility-mass spectrometry. Nat Chem.2011, 3,126-132(15) Bleiholder C, Dupuis NF, Wyttenbac h T, Bowers MT. Ion mobility-mass spectrometry reveals a conformational conversion from random assembly to &beta -sheet in amyloid fibril formation. Nat Chem.2011, 3, 172-177(16) Kasper D. Rand, Steven D. Pringle, Michael Morris, John R., et al. ETD in a Traveling Wave Ion Guide at Tuned Z-Spray Ion Source Conditions Allows for Site-Specific Hydrogen/Deuterium Exchange Measurements. J Am Soc Mass Spectrom. 2011, in press
  • 蛋白质结构解析六十年
    几种不同折叠模式的蛋白质模型(图片来源Protein Data Bank Japan )  上个世纪初,科学家们认为蛋白质是生命体的遗传物质,而具有独特的作用。随着这个理论被证伪,真正的遗传物质DNA的结构被给予了很大关注。然而,蛋白质作为生命体的重要大分子,其重要性也从未被忽视,而且在1950年代开始,科学家一直在探寻DNA序列和蛋白质序列的相关性。与此同时,蛋白质测序和结构解析蛋白质结构的努力开始慢慢获得回报。更多的生化研究揭示了蛋白质的功能重要性,因此蛋白质的三维结构的解析对于深入理解蛋白质功能和生理现象起着决定性作用。  本文简要回顾了蛋白质结构解析的重大历史事件,并总结了蛋白质结构解析的常用方法和结构分析方向。通过了解蛋白质结构,能够让我们更好地理解生物体的蛋白的理化特性,以及其相关联的化学反应途径及其机制,对于我们认识生物世界和研发治疗方法和药物都起着关键作用。在即将召开的2015高分辨率成像与生物医学应用研讨会上,各位专家学者将会进一步讨论相关议题。  蛋白质结构解析六十年来大事件  在1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,然后是更加复杂的血红蛋白Hemoglobin。因此,这两个科学家分享了1962年的诺贝尔化学奖。事实上,这项工作在早在1937年就开始了。  然后在1960年代,蛋白质结构解析方法不断进步,获得了更高的解析精度。这个时期,蛋白质序列和DNA序列间关系也被发现,中心法则被Francis Crick提出,然后科学界见证了分子生物学的崛起。分子生物学(Molecular Biology)的名称在1962年开始被广泛接受和使用,并逐渐演变出一些支派,如结构生物学。然后在1964年,Aaron Klug提出了一种基于X射线衍射原理发展而来的全新的方法电子晶体学显微镜(crystallographic electron microscopy ),可以解析更大蛋白质或者蛋白质核酸复合体结构。因为这项研究,他获得了1982诺贝尔化学奖。1969年,Benno P. Schoenborn 提出可以用中子散射和原子核散射来确定大分子中固定位置的氢原子坐标。  进入1970年代,很多新的方法开始发展。存储蛋白质三维结构的Protein Data Bank(1971年) 开始出现,这对于规范化和积累蛋白质数据有着重要意义。1975年新的一种仪器叫做多丝区域检测器,让X-ray的检测和数据收集更加快速高效。次年,Robert Langride将X-ray衍射数据可视化,并在加州大学圣地亚哥分校成立了一个计算机图形实验室。同年,KeithHodgson和同事首次证明了可以使用同步加速器获得的X射线并对单个晶体进行照射,并取得了很好的实验效果。然后在1978年,核磁共振NMR首次被用于蛋白质结构的解析 同年首个高精度病毒(西红柿丛矮病毒)衣壳蛋白结构被解析。  在1980年代,更多蛋白质结构被解析,蛋白质三维结构的描述越来越成熟,而且蛋白质结构解析也被公认成为药物研发的关键步骤。在1983年,冷冻蚀刻的烟草花叶病毒结构在电子显微镜结构下得到描述。两年后德国科学家John Deisenhofer等解析出了细菌光合反应中心,因此他们共享了1988年的诺贝尔化学奖。次年,两个课题组解析了HIV与复制相关的蛋白酶结构,对针对HIV的药物研发提供了理论基础。  下一个十年,因为大量同步加速器辅助的X射线衍射的使用,数千个蛋白质结构得到解析,迎来了蛋白质结构组的曙光。1990年多波长反常散射方法(MAD)方法用于X射线衍射晶体成像,与同步辐射加速器一起,成为了近二十多年来的最常用的的方法。Rod MacKinnon在199年发表了第一个高精度的钾离子通道蛋白结构,对加深神经科学的理解起了重要作用,因此他分享了2003年的诺贝尔化学奖。Ada Yonath等领导的课题组在1999年首次解析了核糖体结构(一种巨大的RNA蛋白质复合体)。  进入新千年,更多的技术细节被加入到蛋白质解析研究领域。2001年,Roger Kornberg和同事们描述了第一个高精度的RNA聚合酶三维结构,正因此五年后他们共享了诺贝尔化学奖。2007年,首个G蛋白偶联受体结构的解析更是对药物研究带了新的希望。近些年来,越来越多的大的蛋白质结构得到解析。Cryo-EM超低温电子显微镜成像用于超大蛋白质结构成像的研究日益成熟,并开始广泛用于蛋白质结构的解析。  蛋白质结构解析的常用实验方法  1.X-ray衍射晶体学成像  X射线衍射晶体学是最早用于结构解析的实验方法之一。X射线是一种高能短波长的电磁波(本质上属于光子束),被德国科学家伦琴发现,故又被称为伦琴射线。理论和实验都证明了,当X射线打击在分子晶体颗粒上的时候,X射线会发生衍射效应,通过探测器收集这些衍射信号,可以了解晶体中电子密度的分布,再据此析获得粒子的位置信息。利用这种特点,布拉格父子研制出了X射线分光计并测定了一些盐晶体的结构和金刚石结构。首个DNA结构的解析便是利用X射线衍射晶体学获得的。  后来,获得X射线来源的技术得到了改进,如今更多地使用同步辐射的X射线源。来自同步辐射的X射线源可以调节射线的波长和很高的亮度,结合多波长反常散射技术,可以获得更高精度的晶体结构数据,也成为了当今主流的X射线晶体成像学方法。由X射线衍射晶体学解析的结构在RCSB Protein Data Bank中占到了88%。  X射线衍射成像虽然得到了长足的发展,仍然有着一定的缺点。X射线对晶体样本有着很大的损伤,因此常用低温液氮环境来保护生物大分子晶体,但是这种情况下的晶体周围环境非常恶劣,可能会对晶体产生不良影响。而且,X射线衍射方法不能用来解析较大的蛋白质。  上海同步辐射加速器外景(图片来源 上海同步辐射光源网站)  2.NMR核磁共振成像  核磁共振成像NMR全称Nuclear magnetic resonance,最早在1938被Isidor Rabi (1946年诺贝尔奖)描述,在上世纪的后半叶得到了长足发展。其基本理论是,带有孤对电子的原子核(自选量子数为1)在外界磁场影响下,会导致原子核的能级发生塞曼分裂,吸收并释放电磁辐射,即产生共振频谱。这种共振电磁辐射的频率与所处磁场强度成一定比例。利用这种特性,通过分析特定原子释放的电磁辐射结合外加磁场分别,可以用于生物大分子的成像或者其他领域的成像。有些时候,NMR也可以结合其他的实验方法,比如液相色谱或者质谱等。  RCSB Protein Data Bank数据库中存在大约11000个用NMR解析的生物大分子结构,占到总数大约10%的结构。NMR结构解析多是在溶液状态下的蛋白质结构,一般认为比起晶体结构能够描述生物大分子在细胞内真实结构。而且,NMR结构解析能够获得氢原子的结构位置。然而,NMR也并非万能,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。  使用NMR解析的血红蛋白结构建模(图片来源RCSB PDB)  3.Cryo-EM超低温电子显微镜成像  电子显微镜最早出现在1931年,从设计之初就是为了试图获得高分辨率的病毒图像。通过电子束打击样本获得电子的反射而获取样本的图像。而图像的分辨率与电子束的速度和入射角度相关。通过加速的电子束照射特殊处理过的样品表明,电子束反射,并被探测器接收,并成像从而获得图像信息。具体做法是,将样品迅速至于超低温(液氮环境)下并固定在很薄的乙烷(或者水中),并置于样品池,在电子显微镜下成像。图像获得后,通过分析图像中数量众多的同一种蛋白质在不同角度的形状,进行多次的计算机建模从而可以获得近原子级别的精度(最低可以到2.0埃)。  Cyro-EM解析TRPV1离子通道蛋白(图片来源Structure of the TRPV1 ion channel )  将电子显微镜和计算机建模成像结合在一起的大量实践还是在新世纪之后开始流行的。随着捕捉电子的探测器技术(CCD技术,以及后来的高精度电子捕捉、电子计数electron counting设备)的提升,更多的信息和更低的噪音保证了高分辨率的图像。  近些年来,Cryo-EM被用来解析很多结构非常大(无法用X-ray解析)的蛋白质(或者蛋白质复合体),取得了非常好的结果。同时,单电子捕捉技术取代之前的光电转换成像的CCD摄像设备,减少了图像中的噪音和信号衰减,同时并增强了信号。计算机成像技术的成熟和进步,也赋予了Cryo-EM更多的进步空间。然而,Cyro-EM与X-ray不同,该方法不需要蛋白质成为晶体,相同的是都需要低温环境来减少粒子束对样品的损害。  除去介绍的这三种方法以外,计算机建模技术也越来越多地被用在了蛋白质结构解析中。而且新解析的结构也会提高计算机建模的精确度。未来,我们或许能够用计算机构建原子级别的细胞模型,构建在芯片上的细胞。  蛋白质结构对了解生命体的生化反应、有针对性的药物研发有着重要意义。从1958到如今已经接近60年,蛋白质结构解析得到了较快的发展。然而,在如今DNA测序如此高效廉价的时代,蛋白质和DNA结构解析并没有进入真正高速发展阶段,这也导致了在如此多的DNA序列数据非常的今天,结构数据却相对少的可怜。大数据时代的基因组、蛋白质组、代谢组、脂类组等飞速发展的时候,蛋白质结构组也得到了更加广泛的重视。发展高精度、高效的结构解析技术也一直都有着重要意义。未来,蛋白质结构解析,对针对蛋白质的药物筛选,和计算机辅助的药物研究研究不应被低估。未来说不定在蛋白质结构领域有着更多惊喜,让我们拭目以待。 第一届电镜网络会议部分视频回放
  • 药典蛋白质组学分析标准二次公示!增加QC评价标准
    随着质谱技术以及色谱与质谱联用技术的快速发展,蛋白质组学分析技术在未知蛋白质的鉴定、蛋白质结构的解析、靶向蛋白质定量、以及生物技术药物研发、质量控制和体内药代动力学研究方面应用越来越广泛。药典委拟制定《中国药典》蛋白质组学分析方法及应用指导原则,并于2024年2月20日发布第一版公示稿并征求意见。为确保标准的科学性、合理性和适用性,现将拟增订的蛋白质组学分析方法及应用指导原则(第二次)公示征求社会各界意见(详见附件)。公示期自发布之日起一个月。蛋白质组学分析方法及应用指导原则公示稿(第二次).pdf蛋白质组学分析基本流程主要包括:1. 蛋白样品的提取,变性还原,酶解与多肽分离富集;2. 多肽的分析与鉴定;3. 数据分析。在分离和富集中采用凝胶电泳和色谱技术,分析与鉴定中采用质谱、二维凝胶电泳、X射线分析、核磁共振波谱和透射电子显微镜技术。蛋白质组学分析方法及应用指导原则第二次公示稿修改说明 根据 2024 年 2 月蛋白质组学分析方法及应用指导原则第一次公示稿的反馈意见和建议,国家药典委员会相关专业委员会进行了研讨,在第一次公示稿的基础上修订了部分内容,主要为:一、适用范围1. 将文中“蛋白”修改为“蛋白质”。二、蛋白质组学的分析策略 1. 将“通过质谱分析技术检测到肽指纹图谱进行多肽的鉴定和定量分析”修改为“通过质谱分析技术检测肽段一级与二级谱图进行多肽的鉴定和定量分析”。2. 将文中“图谱”修改为“谱图”。三、蛋白质组学分析方法 1.“2.1 质谱技术”增加其他质谱碎裂技术,修订为:“蛋白质组样品经过提取、分离富集或者进一步变性还原、酶切、多肽分离富集处理后,选择适宜的分离系统导入离子源离子化,电离生成带电荷离子,离子通过碰撞诱导解离(Collision induced dissociation, CID)、高能碰撞诱导解离 High energy collision dissociation, HCD)、电子活化解离(Electron activated dissociation,EAD)或其它适宜的解离技术进行碎片化,后在加速电场的作用下形成离子束进入质量分析器,通过质量分析器分离和过滤不同质核比的离子,过滤后的离子最终经检测系统转换为可测量的信号,从而得到质谱图,以获得蛋白质的相关信息”。 2. 将文中“质核比”修改为“质荷比”。 3. 将“数据库检索对肽段碎裂质谱谱图和数据库中的理论序列谱图进行匹配,实现肽段鉴定”修改为“质谱数据文件的数据库检索对肽段碎裂质谱谱图和数据库中的蛋白质计算机模拟消化肽段碎裂模式进行匹配,以进行肽段鉴定”。4. 将“肽谱图匹配(peptide spectrum matching,PSM)”,“肽谱图匹配(peptide-spectrum matches,PSM)”,统一为“肽段谱图匹配 (peptide-spectrum matches, PSMs)”。 5. 将“统计学分析(如 p 值)”修改为“统计学指标(如 p 值)”。 2024 年 6 月 与第一次公示稿比较,修改处加橙色标记 四、蛋白质组学分析的质量控制 1. 在表 1 中增加样品处理中酶解漏切率、酶解位点特异性等 QC 评价指标及描述;增加色谱分析中峰宽和半峰宽等 QC 评价指标及描述;增加质谱分析中TIC 图等 QC 指标及描述。2. 调整仪器性能参数的描述顺序。将“建议结合仪器的性能进行设置,例如可将两个参数均设置为 20ppm,也可以将母离子质量误差设置为 10ppm,子离子质量误差设置为 0.02Da”修改为“建议结合仪器的性能设置质量误差,如将母离子质量误差设置为 10 ppm,子离子质量误差设置为 0.02 Da,也可将两个参数均设置为 20 ppm”。3. 将“鉴定的蛋白质应具有至少 70%的覆盖率,即被鉴定的多肽的氨基酸序列覆盖蛋白质氨基酸序列的百分比,70%的蛋白覆盖率可提高鉴定结果的可信度和全面性”修改为“蛋白质覆盖率是指被鉴定的多肽的氨基酸序列覆盖蛋白质氨基酸序列的百分比,70%及以上的蛋白质覆盖率可提高鉴定结果的可信度和全面性”。
  • 对于人类蛋白质相互作用网络的结构解析
    大家好,本周为大家分享一篇发表在Nat. Struct.上的文章,Towards a structurally resolved human protein interaction network,该文章的通讯作者是瑞典斯德哥尔摩大学的Petras Kundrotas、Arne Elofsson和欧洲分子生物学实验室的Pedro Beltrao。蛋白质-蛋白质相互作用(PPIs)的表征对于理解形成功能单位的蛋白质组和细胞生物学研究的基础是至关重要的。同时,蛋白质复合物的结构表征是理解蛋白质的功能机制、研究突变的影响和研究细胞调控过程的关键步骤。最近,基于神经网络的方法已经被证明了准确预测单个蛋白质和蛋白质复合物的结构的能力;然而,其在大规模预测人类复杂结构中的应用尚未得到有效测试。在此,本文测试了应用AlphaFold2在预测人类蛋白质相互作用结构上的潜力和局限性,并通过实验提示了界面残基中潜在的调节机制。除此之外,本文还提供了使用预测的二元复合物来构建高阶组装的案例,以此拓展了对于人类细胞生物学的理解。人类蛋白质相互作用的结构预测本文基于AlphaFold2的FoldDock管道对65484对来源于HuRI与hu.MAP V.2.0数据库中实验测定的PPIs的结构进行预测。文章合并了一个pDockQ分数,该分数可以根据置信度对模型进行排序。结果显示,已知相互作用蛋白的pDockQ往往高于随机集;对于hu.MAP数据集显示出平均比HuRI数据集更高的可信度,这表明,高可信度模型集中在具有高亲和力和直接相互作用的蛋白质相互作用区域。实验表明,AlphaFold2可以预测大型复合物中直接相互作用的蛋白对的结构(图1)。图1 | AlphaFold2复合物预测在大规模人类PPIs数据集上的应用影响预测置信度的特征如图1a所示,相较于HuRI和hu. MAP数据库中的蛋白质对,出现在蛋白质数据库(PDB)中的蛋白质对更加富集于高分模型部分。为了更好地理解这种差异,本文首先研究了一个由大型(10链)异质蛋白复合物构建的额外数据集。通过实验,结果显示直接相互作用对与间接相互作用对之间pDockQ分数的差异是显著的,这表明与间接相互作用对相比,即使直接相互作用对是大型复合体的一部分,也往往能够被预测。除此之外,由于HuRI数据库中的许多蛋白质间相互作用很可能是短暂的,而AlphaFold2无法可靠地预测这种相互作用(图2)。图2 | 影响预测置信度的蛋白质和相互作用特征:不同数据集的分析预测的复合物结构在化学交联上的验证化学交联结合质谱分析是一种识别蛋白质对中邻近的活性残基的方法,可以用来帮助确定可能的蛋白质界面。为了确定预测的复合物结构是否满足这种正交空间约束,本文获取了528对具有预测模型的蛋白质对的残基对的交联集合。在此章节中,文章提供了多个案例证明了化学交联验证的有效性(图3)。图3 | 对于预测复合物模型的化学交联支持复合物界面上与疾病相关的错义突变与人类疾病相关的错义突变可以通过多种机制改变蛋白质的功能,包括破坏蛋白质的稳定性、变构调节酶活性和改变PPIs。为了确定预测结构的有效性,本文汇编了一组位于界面残基上的突变,这些突变之前曾被实验测试过对于相应相互作用的影响。文章使用FoldX预测突变时结合亲和力的变化,并观察到破坏相互作用的突变强烈影响了结合的稳定性;另外,本文就在一系列生物学功能中具有界面疾病突变的蛋白质网络簇进行了举例说明(图4)。图4 | 蛋白质复合物界面残基的疾病突变蛋白质复合物界面的磷酸化调节蛋白质磷酸化可以通过改变修饰残基的大小和电荷来调节结合亲和力来调节蛋白质的相互作用,将磷酸化位点定位到蛋白质界面可以为它们在控制蛋白质相互作用中的功能作用产生机制假说。本文使用了最近对人类磷酸化蛋白质组26的鉴定,在高置信度模型中鉴定出了界面残基上的4,145个独特的磷酸化位点。实验表明,某些界面可能受到特定激酶和条件的协调调控。虽然不是所有界面上的磷酸位点都可能调节结合亲和力,但这一分析为特定扰动后的相互作用的潜在协调调控提供了假设(图5)。图5 | 界面残基上磷酸化位点的协同调控来自二元蛋白质相互作用的高阶组装蛋白质既能够同时与多个伙伴相互作用组成更大的蛋白复合物,又能够在时间和空间上分离。这也反映在文章的结构特征网络中,即蛋白质可以在群体中被发现,如蛋白质相互作用全局网络视图所示(图6)。由于使用AlphaFold2预测更大的复合物组装可能受到计算需求的限制,文章测试了蛋白质对的结构是否可以迭代结构上对齐。文章在上述网络中覆盖的一组小的复合物上测试了这一过程,并将一个实验确定的结构与预测的模型进行对齐,展示了该过程的潜力和局限性。受测试例子的鼓励,本文定义了一个自动化过程,通过迭代对齐生成更大的模型。总之,文章发现可以迭代地对齐相互作用的蛋白质对的结构来构建更大的组装,但同时也发现了目前限制这一过程的问题。图6 | 对高阶组装的蛋白质复合物的预测结论本文通过一系列的实验评估了应用AlphaFold2预测已知人类PPIs的复杂结构的潜力与局限性。分析结果表明,由亲和纯化、共分馏和互补的方法组合支撑的蛋白质相互作用能够产生更高置信度的模型。文章证明,可以使用模型指标(如pDockQ评分)对高置信度模型进行排序,为大规模PPIs和稳定复合物的详细研究提供支持;而来自交联质谱实验的数据为进一步验证这些预测提供了理想的资源。除此之外,本文用疾病突变和磷酸化数据证明了蛋白质界面的结构模型对于理解分子机制以及突变和翻译后修饰的影响至关重要;最后,文章提出了从预测的二元配合物出发构建更大的组件结构模型的想法。后续仍需要更多的工作来确定确切的化学计量学,设计方法和评分系统来构建如此更大的复杂组件,以及预测具有弱和瞬态相互作用的蛋白质之间的相互作用。参考文献(1) Burke DF, Bryant P, Barrio-Hernandez I, et al. Towards a structurally resolved human protein interaction network [published online ahead of print, 2023 Jan 23]. Nat Struct Mol Biol. 2023 10.1038/s41594-022-00910-8. doi:10.1038/s41594-022-00910-8
  • 定量蛋白质组学揭示内质网应激作用下蛋白质的构象变化
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章Quantitative Structural Proteomics Unveils the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress1,文章的通讯作者是来自美国佐治亚理工学院的Ronghu Wu助理教授。在真核细胞中,内质网(endoplasmic reticulum,ER)负责蛋白质组中40%蛋白质的合成和成熟。蛋白质合成或折叠过程中的变化都将影响内质网的稳态,进而导致未折叠蛋白的积累和蛋白分泌效率的降低。在过去几十年的研究中,内质网应激反应被广泛研究,但是内质网应激反应后蛋白质折叠状态的变化却没有被深入研究。基于丰度的蛋白质组学方法不能直接用于分析蛋白质状态的变化,在这篇文章中,作者整合了半胱氨酸(cysteine,Cys)共价标记、选择性富集和定量蛋白质组学,称为半胱氨酸靶向共价蛋白绘制(cysteine targeted covalent protein painting,Cys-CPP),用于研究蛋白质组范围内的蛋白质结构和变化(图1A)。  使用CPP分析蛋白质结构,需要一种具有高反应活性的探针。作者设计了一种针对半胱氨酸的探针,其中包含半胱氨酸反应基团、用于富集的生物素部分和用于生成半胱氨酸特异性识别位点标签的可裂解连接部分(图1B)。以变性处理后的蛋白样品作为蛋白质展开形式的参考,计算肽段在原始样本和变性样本中的比例从而获得宝贵的蛋白质结构信息。  图1.利用半胱氨酸反应探针定量分析人细胞蛋白质组中半胱氨酸暴露率的原理。(A)Cys-CPP的一般工作流程。(B)半胱氨酸残基与探针之间的反应。富集后,进行紫外裂解,在修饰的半胱氨酸上留下一个小标记,用质谱进行位点特异性分析。  半胱氨酸暴露率Rexpo通过每条肽段在原始样本和变性样本中的比值进行计算。结果显示:(1)半胱氨酸的暴露率和溶剂可及性呈现正相关(图2C) (2)在丝氨酸和苏氨酸等极性氨基酸残基旁边的半胱氨酸具有相对较高的暴露率,这与人们普遍认为亲水残基更有可能暴露在蛋白质表面的观点一致 (3)甘氨酸和脯氨酸附近的半胱氨酸具有更高的暴露率,这是因为这两种氨基酸通常出现在蛋白质的转角和环结构中,对半胱氨酸的空间位阻较小 (4)半胱氨酸暴露率与其有/无序区(图2D)或所处二级结构(图2E)的相关性分析均表明,较低的暴露率与更稳定和结构化的局部环境有很好的相关性。这些数据结果共同证明目前的方法可以准确地测得半胱氨酸暴露率,并为蛋白质结构提供有价值的信息。  图2.HEK293T细胞中半胱氨酸暴露率的分析。(A) VAHALAEGLGVIAC#IGEK(#代表标记位点)的串联质谱样本。报告离子的强度使我们可以准确定量一个半胱氨酸的暴露率(左框为报告离子强度的放大视图)。(B)蛋白CCT3中被定量半胱氨酸的定位和暴露率演示(PDB代码:6qb8)。(C−E)比较不同的溶剂可及性(C)、预测无序区(D)和二级结构(E)的半胱氨酸暴露率。  衣霉素(Tunicamycin,Tm)可抑制 N-糖基化并阻断 GlcNAc 磷酸转移酶 (GPT)。由于蛋白质的N-糖基化经常发生在共翻译过程中,在蛋白质折叠的调节中起着至关重要的作用,所以衣霉素会引起细胞内质网中未折叠蛋白的积累并诱导内质网应激。基于此,作者用衣霉素对细胞进行处理,计算并对比了衣霉素处理样本和正常样本中的半胱氨酸暴露率。正如预期的那样,Tm处理样本中许多半胱氨酸的暴露率升高,且Tm对于蛋白质不稳定区域的作用尤为显著。根据Tm处理样本和正常样本之间半胱氨酸暴露率的差值,作者将所有位点划分为5个部分,在Tm处理下,近三分之一的半胱氨酸定位区域没有明显的结构变化(差值在-0.05~0.05之间),而28%的位点则高度暴露(差值0.15)(图3B)。对这两种蛋白质进行基因本体(GeneOntology,GO)功能富集分析(图3C),结果显示:差值在-0.05~0.05之间的蛋白通常是糖异生或折叠过后具有良好结构区域的蛋白,而差值0.15的蛋白则是与囊泡转运相关的蛋白。这表明抑制N-糖基化主要影响经典分泌途径中的蛋白质,与预期相符。  图3.利用Tm抑制蛋白质N-糖基化对蛋白质折叠影响的系统研究。(A)Tm处理和对照样品之间半胱氨酸暴露率的比较。(B) 不同暴露率变化范围内的蛋白质数量。(C)在具有高度展开或稳定区域半胱氨酸的蛋白之间进行GO功能富集分析。  由于Tm对于预先存在的、折叠良好的蛋白质所产生的影响可能远小于对新合成蛋白的影响,分别研究Tm对这两种蛋白的影响是必要的。作者通过将目前的方法Cys-CPP与细胞培养中氨基酸的稳定同位素标记(pSILAC)结合(图4A),探究了细胞中已存在蛋白和新合成蛋白在内质网应激作用下的不同变化。结果显示:(1)抑制N-糖基化对新合成蛋白的去折叠影响比对已存在蛋白的影响更显著(图4C) (2)N-糖基化除了调节蛋白质的二级结构外,在蛋白质三级或四级结构的形成中起着更重要的作用(图4D)。  图4. 抑制N-糖基化对新合成蛋白和已存在蛋白折叠状态影响的研究。(A)量化新合成蛋白和已存在蛋白折叠状态变化的实验设置。(B) 经Tm处理和未经处理的细胞中新合成和已存在蛋白质的重叠。括号内为每组蛋白质数。(C)不同蛋白质组中暴露率的分布。(D) 在有或没有Tm处理的细胞中、在不同的二级结构下,新合成和已存在蛋白之间半胱氨酸暴露率的差值分布。  本文通过设计一种半胱氨酸靶向探针,定量半胱氨酸残基的暴露率,系统地研究了蛋白质的结构以及结构的变化。结果表明,半胱氨酸暴露率与蛋白质局部结构的相关性非常好。利用该方法,作者研究了Tm引起的内质网应激反应下细胞中蛋白质的结构变化。此外,通过将Cys-CPP与pSILAC结合,研究了在内质网应激反应下原有蛋白和新合成蛋白的结构变化差异,并详细分析了内质网应激对蛋白质去折叠的影响,深入和准确地了解内质网应激下的蛋白质结构变化,有助于深入了解蛋白质的功能和细胞活性。  参考文献:[1] Yin K, Tong M, Sun F, et al. Quantitative Structural Proteomics Unveil the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress[J]. Analytical Chemistry, 2022,
  • 布鲁克在ASMS 2016推出蛋白质结构分析解决方案—HDX Solution
    布鲁克在第64届美国质谱年会(ASMS 2016)宣布推出布鲁克HDX Solution —氢氘交换解决方案。BHDX解决方案将LEAP H/D-X PAL自动样品处理系统与布鲁克maXis II ETD UHR-QTOF质谱系统以及HDExaminer软件相结合,提供了一套自动可靠的HDX-MS工作流。Bruker HDX解决方案通过H/D比值获得单一同位素精确定量分析结果,为深入了解生物分子结构提供可靠依据。  这些年来,生物制药表征分析需要对生物蛋白的空间构象有更加深入的了解,还要了解多种因素如pH值、温度和压力等对蛋白的影响。对于这一挑战,HDX-MS已经成为了一种有价值的分析技术。生物制药分析方法需要运用强大的分析统计工具,自动化的提供高质量数据。HDX-MS已成为生物制药领域的常规而可靠的分析方法。  关键结构的鉴定、药物/蛋白的解析以及蛋白之间相互作用、蛋白质构象变化等是目前生物治疗发展过程中面临的关键问题。Bruker HDX解决方案使得液相分离和MS/MS检测自动化,简化数据分析和解析工作,并能获得可靠的蛋白结构解析结果。  布鲁克道尔顿生物制药副总裁Bob Galvin博士评论说:“最新Bruker HDX解决方案的推出,进一步加强了布鲁克生物表征产品系列,使得生物制药领域的研究者能够更快、更准确的深入了解到蛋白质构象和相互作用。”关于HDX解决方案  Bruker HDX解决方案提供了完整的工作流程,将LEAP H / DX PAL自动进样器应用于预定标记实验,并结合了UHPLC系统与高分辨质谱系统。maXis II ETD UHR-QTOF质谱系统的质量准确度达到ppm级以下,高灵敏度与同位素保真度提高了系统获取准确H/D比值的能力。再加上HDX-MS解析软件Sierra Analytics HDExaminer的应用,创造了更大的应用空间与简便的应用环境。LEAP H / DX PAL自动进样器与maXis II ETD UHR-QTOF质谱系统  在市场处于领先的超高质量分辨率QTOF质谱与ETD(电子转移解离)能力结合,开创了布鲁克maXis II系统HDX-MS实验的新纪元。比起在肽段水平的研究,在更微量水平的探索能更容易的提供特异性识别位点。LEAP H/D-X PAL自动进样设备将稳健可靠的样品处理整合到布鲁克HDX 解决方案。革新的时间安排软件能够自动安排样品处理步骤,包括贴标签、培养、消化和灭活等,提高LC的效率与整个实验室效率。  用HDExaminer软件获得的信息可用于研究在干扰状态下蛋白质的构象变化。通过数据输出,有关这些变化的数据信息可被容易的可视化,也可通过导入如PyMol的晶体结构可视化程序更深入的了解这些变化。  海德堡大学分子生物学中心的Matthias P. Mayer教授表示:“通过布鲁克HDX解决方案,我们能够以高精度、高重复性和最小的动手时间测量氢交换反应动力学。系统的自动安排软件帮助我们充分利用仪器使用时间,从而提高我们的实验室效率”编译:郭浩楠
  • “蛋白质动态学新技术”成功解析蛋白复合体结构
    近日,中国科学院武汉物理与数学研究所研究员唐淳课题组利用基于973重大科学研究计划“蛋白质动态学研究的新技术新方法”建立的研究技术,协助华中农业大学教授殷平课题组首次解析了N6腺嘌呤甲基转移酶METTL3-METTL14蛋白复合体结构,该研究成果发表于《自然》杂志。  该工作揭示了RNA N6腺嘌呤甲基化修饰过程中的结构基础,是表观遗传学领域的一项重大突破。唐淳、武汉物数所副研究员龚洲和博士后刘主参与该项目,利用课题组发展的新技术新方法,通过结合小角X光散射与计算机模拟的手段,为该蛋白复合体的结构解析提供了研究方法上的帮助。  经过近3年的努力,唐淳课题组发展、建立了包括核磁共振波谱、小角X光散射、化学交联质谱分析、单分子荧光检测和成像等技术在内的多种生物物理化学手段,并开发相应的整合计算方法,用于蛋白质动态结构及其转换过程的研究。课题组除了完成自身的科研项目外,积极开展广泛的合作与交流,与国内外同行共享研究技术和方法。目前,得益于“蛋白质动态学研究的新技术新方法”项目的实施,课题组已助力多个重要蛋白质结构的解析,取得了一系列的研究成果,研究成果发表于《自然—化学生物学》、eLife 等国际一流杂志。
  • 阿里云携手英特尔举办“冷冻电镜蛋白质结构建模大赛” 近900参赛队伍角逐28万奖金
    仪器信息网讯 日前,阿里云携手英特尔(中国)举办办的“英特尔创新大师杯”冷冻电镜蛋白质结构建模大赛正在开放报名中,目前已有近900个参赛队伍报名,将在接下来的近三个月内角逐28万元奖金。蛋白质的空间结构是结构生物学的关键研究对象,其对于理解蛋白质功能以及相关生物学过程的工作机理有非常重要的意义。准确的蛋白质结构原子模型不仅能够帮助研究者在理论上理解生命活动的内在原理,同时也能为药物研发等诸多工程实践提供指导。2021年7月,人工智能预测蛋白质3D结构技术一声惊雷,DeepMind和华盛顿大学团队的最新成果同日抢发Nature和Science!去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数十年的问题“已被解决”。 具体而言,AlphaFold2 在国际蛋白质结构预测竞赛(CASP)上精确地基于氨基酸序列预测蛋白质的3D结构。其准确性可以与使用冷冻电镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。据介绍,本次大赛将基于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)进行。阿里云E-HPC平台,基于阿里云基础设施,可灵活生产基于任何ECS实例构成的HPC集群,满足不同应用特征的性价比要求。阿里云E-HPC主要面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。计算实例基于第三代英特尔至强可扩展处理器(CooperLake),通过高效、面向未来的服务器基础设施提供卓越的性能和灵活性,推动新的业务突破和科学发现。英特尔深度学习加速和增强型英特尔AVX-512等内置优势提供了人工智能和HPC的融合以及工作负载性能。同时运用基于第三代英特尔至强可扩展处理器(IceLake)的Software Guard Expressions技术,通过内存中独立于操作系统或硬件配置的应用程序隔断,提供细粒度的数据保护。本次大赛意在探索基于大数据训练的人工智能方法在由电势能分布获取蛋白质原子模型方面的潜力。大赛组织主办单位:阿里云计算有限公司、英特尔(中国)有限公司指导单位:国家蛋白质科学中心(上海)承办单位:阿里云高性能计算、阿里巴巴达摩院、阿里云天池平台赛事链接:https://tianchi.aliyun.com/competition/entrance/531916/introduction 背景介绍蛋白质的空间结构是结构生物学的关键研究对象,其对于理解蛋白质功能以及相关生物学过程的工作机理有非常重要的意义。准确的蛋白质结构原子模型不仅能够帮助研究者在理论上理解生命活动的内在原理,同时也能为药物研发等诸多工程实践提供指导。目前解析蛋白质结构的主流方法有x射线晶体学(x-ray crystallography)、核磁共振波谱法(nuclear magnetic resonance spectroscopy)和冷冻电镜方法(cryo-electron microscopy),其中前两者具有长时间的实践积累和成熟的工作流程以及较为严苛的使用条件。今年来随着软硬件方面的突破,冷冻电镜方法,尤其是冷冻电镜单颗粒分析(single-particle cryo-EM)以其易用性和对生物样品相对宽松的要求逐渐成为获取蛋白质结构,尤其是生物大分子复合体结构的首选方案。在冷冻电镜单颗粒结构解析中,蛋白质被速冻在玻璃态的冰层里,电镜产生的电子束与其发生相互作用后被直接电子探测器捕捉,生成大量二维投影图像,之后利用专业软件重构出蛋白质的电势能分布,再基于电势能分布搭建出蛋白质的原子模型。获取蛋白质电势能分布目前已经有较为成熟的软件来完成,而从电势能分布获取原子模型则主要还是由研究人员手动操作,虽然有各种辅助软件可以利用,但是出于对准确度的要求,此项工作仍旧是整个工作流程中比较繁琐且主观性较强的环节。枚举每一种蛋白质可能存在的结构,需要花费大量的时间。最近,在强大的算法与算力的支持下,DeepMind将运算时间从数月缩短至了数小时。AI生物学带来了极致的效率革命,这对于人类攻克癌症等疑难杂症有着划时代的意义。要在数据洪流的时代实现重大的科学突破、分析基因组数据,应用于药物研发、疾病检测、个性化治疗,依赖于高效便捷的大数据分析技术和强大的计算平台支持。蛋白质破解的事件是一个标志,在生命科学领域取得突破性进展还需要高效的HPC系统和强大的算力,分析计算复杂、散点化、非结构化的生物医学大数据。本次大赛将基于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)进行。阿里云E-HPC平台,基于阿里云基础设施,可灵活生产基于任何ECS实例构成的HPC集群,满足不同应用特征的性价比要求。阿里云E-HPC主要面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。计算实例基于第三代英特尔至强可扩展处理器(CooperLake),通过高效、面向未来的服务器基础设施提供卓越的性能和灵活性,推动新的业务突破和科学发现。英特尔深度学习加速和增强型英特尔AVX-512等内置优势提供了人工智能和HPC的融合以及工作负载性能。同时运用基于第三代英特尔至强可扩展处理器(IceLake)的Software Guard Expressions技术,通过内存中独立于操作系统或硬件配置的应用程序隔断,提供细粒度的数据保护。本次大赛意在探索基于大数据训练的人工智能方法在由电势能分布获取蛋白质原子模型方面的潜力。赛程安排本次大赛分为初赛、复赛和决赛三个阶段,具体安排和要求如下:报名与实名认证(即日起—2021年9月28日,UTC+8)初赛(2021年8月16日-2021年9月29日,UTC+8)复赛(2021年10月11日—2021年11月11日,UTC+8)决赛答辩(11月下旬)奖项设置相关:2020年蛋白质结构预测大赛据悉,2020年,阿里云发起“蛋白质结构预测大赛”,当时赛题由达摩院顾斐博士、天津大学博士夏启等志愿者设计,数据来源于蛋白质数据库(PDC),希望通过比赛让更多跨学科开发者参与蛋白质二级结构预测研究中,以技术抗击疫情。最终参赛队伍为242个。
  • 2015技术展望之蛋白质分析
    蛋白质是细胞功能的执行者,是一切生命的物质基础。然而人们对蛋白质和蛋白质组的了解还远远不够,蛋白质分析被认为是一项复杂而艰巨的任务。2015年是蛋白质领域的关键一年,有可能决定着蛋白质分析的未来走向。  1.人类蛋白互作图谱取得更大的成果。最近Cell杂志上发表了一项大规模的蛋白质研究,科学家们鉴定了一万四千个蛋白相互作用,获得了迄今为止最大规模的人类蛋白互作图谱。他们计划将在未来六年中逐步完成人类基因组的全部互作图谱。这种图谱可以帮助人们更全面的了解人类互作组,进一步理解疾病的发生和发展。对新发现的蛋白互作进行研究,能够揭示基因型和表型之间的真实关系。我们期待在2015年看到这类研究结出更多硕果。  2.人造环境为蛋白质分析提供便利。今年八月Roy Bar-Ziv及其同事在Science杂志上发表文章,展示了以微流体DNA隔室为基础的人造细胞。这些二维的人造细胞可以实现预编程的蛋白合成、代谢和通讯,是一种非常灵活的蛋白合成系统。研究显示,人造细胞能够更好的模拟蛋白表达的动态模式,维持蛋白信号的梯度。人们可以利用这一系统来评估蛋白质的活性和相互作用,这种方法将对蛋白质功能研究产生重要的影响。  3. 一个时代的终结&mdash &mdash 蛋白质结构计划PSI收官。PSI项目在运行了十五年后,正逐步走向自己的终点。PSI项目已经确定了六千三百多个蛋白结构,为蛋白质分析做出了重要的贡献。那些为PSI而建的高通量蛋白生产中心可能会继续维持下去,给其他结构生物学实验室使用。结构生物学家们也可能启动与数据处理有关的中、大型项目,作为PSI的延续。  不管怎样,对于蛋白质领域来说明年都是特别的一年,研究者们需要决定PSI之后的前进方向。我们希望未来能有更多类似人类互作组图谱的大型项目,增进我们对蛋白质结构和功能的理解。
  • 自然通讯成果|非变性纳米蛋白质组学捕获内源性心肌肌钙蛋白复合物的结构和动态性信息
    大家好,本周为大家分享一篇发表在Nat. Commun.上的文章:Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics ,文章的通讯作者是威斯康星大学麦迪逊分校的葛瑛教授。  蛋白质大多都是通过组装成蛋白复合物来执行特定的生物功能,因而表征内源性蛋白复合物的结构和动力学将有助于生命过程的理解。蛋白复合物在其组装、翻译后修饰(Post-translational modifications,PTMs)和非共价结合等方面是高度动态的,在native状态下通常以低丰度存在,这给研究其结构和动态性的传统结构生物学技术(如X-ray和NMR)带来了巨大的挑战。非变性Top-down质谱(nTDMS)结合了非变性质谱和Top-down蛋白组学的优势,目前已发展成蛋白复合物结构表征的有力工具,可以保留蛋白质亚基-配体间的非共价作用和PTMs等重要信息。然而,由于内源性蛋白复合物自身的低丰度特性,导致对其的分离纯化和检测非常困难,所以nTDMS目前仅限用于过表达的重组或高丰度蛋白质的表征。在本研究中,作者开发了一种非变性纳米蛋白质组学(Native nanoproteomics)技术平台,通过使用表面功能化的超顺磁性纳米颗粒(Nanoparticles,NPs)直接富集组织中的蛋白复合物,然后再利用高分辨质谱表征其结构和动态性。这里选用心肌肌钙蛋白(Cardiac troponin,cTn)异源三聚体复合物(~77 kDa)作为研究对象。cTn三聚体复合物是调节横纹肌肌动蛋白收缩的Ca2+离子调节蛋白,由TnC、cTnI和cTnT这3个亚基组成。其中,TnC是Ca2+结合亚基,cTnI是抑制肌动蛋白-肌球蛋白相互作用的亚基,而cTnT细丝锚定亚基。TnC与Ca2+的结合,以及cTnI 亚基的磷酸化,会共同引起细丝上的分子级联事件,诱导心肌收缩所必需的肌动蛋白-肌球蛋白交叉桥的形成。传统结构生物学技术不能有效捕获cTn复合物高度动态的构象变化,并且先前研究用的cTn复合物是由原核细胞表达的,缺乏PTMs的信息。因此,作者开发了native纳米蛋白组学的方法,以实现对人内源性cTn复合物结构和动力学的全面表征。作者首先使用肽功能化的超顺磁性氧化铁NPs富集了人心脏的内源性cTn复合物,同时优化了非变性蛋白提取缓冲液(高离子强度LiCl溶液,生理pH)。富集到的cTn复合物中的3种亚基的含量比例为1:1:1,真实反应了肌节cTn异源三聚体复合物的组成。作者也发现含有750 mM L-Arg,750 mM咪唑和50 mM L-Glu(pH 7.5)的溶液对蛋白复合物的洗脱效果最好,并且不会破坏亚基间的相互作用。该富集方法具有很好的重现性,proteoforms信息得到很好保留,且可以直接用于化学计量分析。总的实验流程如图1所示,洗脱后的cTn复合物经体积排阻色谱(Sze-exclusion chromatography,SEC)除盐和交换至醋酸铵溶液中,随后对cTn复合物进行多种nTDMS分析:1)在线SEC监测复合物 2)超高分辨傅里叶变换离子回旋共振质谱(FTICR-MS)表征复合物的化学计量比和proteoforms 3)捕获离子淌度质谱(TIMS-MS)解析调控复合物构象变化中的非共价作用的结构动态性。  图1. 用于表征人心脏中内源性cTn复合物的native纳米蛋白组学平台。  为了全面表征内源性cTn复合物,作者使用FTICR-MS进行proteoforms测序和复合物表征。图2展示了native状态下检测丰度最高的cTn复合物的电荷态(19+),其中包含了4种独特的proteoforms,这些复合物主要带有单磷酸化的cTnT、单磷酸化和双磷酸化的cTnI,以及结合了3个Ca2+的TnC。这些结果表明人cTn复合物在肌节中以结构多样化的分子组成存在,具有高度异质的共价和非共价修饰,可产生一系列不同的完整复合物。  图2. FTICR-MS分析展示的cTn复合物状态。红色方框中是最高丰度电荷态(19+)的放大谱图,理论同位素分布(红色圆圈)可以与谱图很好叠加,说明结果具有高质量精度(质量偏差在2 ppm 以内)。  作者接着对cTn复合物进行complex-up分析,以研究复合物的化学计量比及其组成。图3a~3b分别显示的是完整cTn三聚体复合物,以及经CAD碎裂后的蛋白亚基谱图。但这里没有检测到cTnI单体,可能是因为cTnI和TnC在native状态下的亲和力很强,且cTnI单体带的电荷不多,导致其在高m/z区域出峰,所以不易被检测到.随后,作者又对解离出的亚基进行complex-down分析。图3c展示了检测到的cTnT的多种proteoforms:未磷酸化的 cTnT、单磷酸化的cTnT(p cTnT)和 C 端 Lys 截断的磷酸化cTnT(pcTnT [aa 1-286]),CAD碎裂谱图也发现cTnT的C端较N端更易暴露在外界溶剂中。图3e则是cTn(I-C)二聚体的谱图,共检测到6种具有不同数量Ca2+结合和磷酸化的proteoforms。二级谱图可将cTnI的两个磷酸化位点准确定位在Ser22和Ser23,同时发现cTnI序列两端都较内部区域更易暴露于溶剂中。但还无法通过nTDMS准确推断Ca2+结合和磷酸化是如何影响cTn复合物的稳定性。作者在此也没有优化FTICR-MS在非常高m/z范围的离子检测,所以也会遗漏带少量电荷的cTn复合物信息。  图3.nTDMS表征人心脏来源的cTn复合物。(a~b)完整cTn复合物和经CAD碎裂后的亚基谱图 (c~d)cTnT单体及其代表性的CAD碎裂谱图 (e~f)cTn(I-C)二聚体及其代表性的CAD碎裂谱图。  人TnC蛋白含有3个钙结合EF-hand基序(结构域 II~IV)。结构域 II与Ca2+结合的亲和力较低,是触发心肌收缩的调控域。结构域 III 和 IV则与Ca2+具有强的亲和力,在心肌舒张和收缩时均始终保持与Ca2+充分结合,但结构域 II只有在收缩时才被Ca2+占据。这里观察到了TnC分别与0、1、2和3个Ca2+结合的情况,通过CAD碎裂也进一步定位了TnC与Ca2+结合的具体氨基酸序列(图4)。研究发现结构域 II的骨架最容易发生碎裂,而结构域 III的骨架最难碎裂。目前结构域 II~IV的序列在UniprotKb中分别对应65DEDGSGTVDFDE76、105DKNADGYIDLDE116和141DKNNDGRIDY152。这里分别将与1、2和3个Ca2+结合的TnC隔离出来进行CAD碎裂(m/z分别为2312、2316和2321),可以更准确地将结构域 III、II和IV的序列分别定位到113DLD115、141DKNND145和73DFDE76(图4c),表明非变性纳米蛋白组学方法在定位非共价金属结合方面具有高分辨能力。  图4.nTDMS定位 TnC与Ca2+结合的结构域。(a)FTICR-MS隔离与不同数量Ca2+结合的TnC单体 (b~c)与两个Ca2+结合的TnC的CAD碎裂谱图,蓝色、红色和黄色方框分别对应结构域 II 、III和IV。  Ca2+与TnC的结合会对cTn复合物的功能和构象有着很大影响。cTn复合物的核心区维持着构象的稳定,但当Ca2+与TnC发生结合时,其柔性区会经历广泛的构象变化,复合物结构会从“closed”状态转变成“opened”状态,这会促进肌动蛋白和肌球蛋白间的相互作用,最终导致心肌收缩。然而,传统结构生物学技术很难捕获cTn复合物与Ca2+结合时的构象变化。因此,作者使用离子淌度质谱来分析cTn复合物的构象变化。TnC亚基和与Ca2+结合的cTn(I-C)二聚体的淌度分离谱图如图5所示。与0~3个Ca2+结合的TnC的碰撞截面(Collision Cross-Section,CCS)值分别为1853、1849、1829和1844 Å2(图5a~5b),TnC构象比IMPACT预测的更为紧凑,但cTn(I-C)二聚体的CCS值与预测的非常接近(图5c~5d)。作者推测TnC与两个Ca2+结合会形成更致密的构象,是因为在静息舒张时Ca2+与结构域 III 和 IV充分结合。当第三个 Ca2+与结构域II结合时,TnC转变为“opened”构象,使其N端与cTnI的C端相结合,进而引发心肌收缩(图5e)。cTn(I-C)二聚体与Ca2+结合时的构象变化也是如此(图5f)。  图5.TnC单体(a~b)和与Ca2+结合的cTn(I-C)二聚体(c~d)的离子淌度分离谱图 (e~f)TnC和cTn(I-C)二聚体与Ca2+结合时的构象变化。  最后,作者通过添加EGTA来剥离cTn复合物中的Ca2+,以进一步研究Ca2+在维持复合物结构稳定性上的作用。图6b~6c是没有EGTA孵育时的cTn复合物的TIMS-MS谱图。cTn复合物的CCS值与理论预测值非常符合。随着EGTA孵育浓度的增加(25、50和100mM),Ca2+逐渐被螯合,cTn复合物的结构也越来越舒展,体现在平均电荷态逐渐增加,以及逐渐在较低m/z范围内出峰,这表明cTn复合物构象的稳定性丢失与EGTA浓度的增加相关(图6d~6f)。虽然100mM EGTA孵育也不敢保证Ca2+的完全剥离,并且cTnI的存在又会增强TnC与Ca2+的结合,但TIMS-MS为我们研究cTn复合物与Ca2+结合时的构象变化提供了一种切实可行的分析手段。  图6.cTn复合物与EGTA孵育时的构象变化。(a)cTn复合物的构象随EGTA孵育浓度的增加发生改变 (b~c)cTn复合物的TIMS-MS谱图 (d~f)cTn复合物与不同浓度EGTA(25、50和100mM)孵育的谱图和CCS分析。  总的来说,本研究开发了一种可用于内源性蛋白复合物富集和结构表征的非变性纳米蛋白组学方法,以获取其组装、proteoforms异质性和动态非共价结合等方面的生物信息。本文采用的功能化NPs可被灵活设计成选择性结合特定的靶蛋白,在富集和洗脱过程中可以很好保持其近似生理条件下的存在状态。更为重要的是,功能化NPs与nTDMS的整合可以作为一种强有力的结构生物学工具,可以作为传统技术的补充,用于内源性蛋白复合物的表征。  撰稿:陈昌明 编辑:李惠琳文章引用:Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics  参考文献  Chapman EA, Roberts DS, Tiambeng TN, et al. Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics. Nat Commun. 2023 14(1):8400. Published 2023 Dec 18. doi:10.1038/s41467-023-43321-z
  • 颜宁等点评:AI 精准预测蛋白质结构,结构生物学何去何从?
    p style="text-indent: 2em "12 月 1 日,谷歌旗下的 DeepMind 公司宣布,其strong新一代 AlphaFold 人工智能系统/strong在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,strong精确预测了蛋白质的三维结构/strong,strong准确性可与冷冻电子显微镜(cryo-EM)、核磁共振或 X 射线晶体学等实验技术相媲美。/strong/ppbr//pp style="text-indent: 2em "(详见《解决生物学 50 年来的重大挑战!生物界「AlphaGo」精准预测蛋白质结构》)这一消息引发了全球媒体关注,前 Genentech 首席执行官 Arthur D. Levinson 博士盛赞这一成就是strong「划时代的进步」/strong。/ppbr//pp style="text-indent: 2em "人工智能的「进击」对生物学、对其他学科会有什么影响?网络上有人提出:strongAI 都能解蛋白质结构了,结构生物学家是不是该失业了?/strong/ppbr//pp style="text-indent: 2em "《返朴》总编、结构生物学家颜宁特邀几位同仁对这一新闻各抒己见, 回答大家的疑问。/pp style="text-align: center text-indent: 2em "img style="max-width: 100% max-height: 100% width: 558px height: 618px " src="https://img1.17img.cn/17img/images/202012/uepic/73bb911a-86ca-490b-a90a-f01fb76aa418.jpg" title="微信图片_20201204191414.jpg" alt="微信图片_20201204191414.jpg" width="558" height="618"//pp style="text-align: center text-indent: 2em "span style="font-size: 12px "by Asier Sanz | https://asiersanz.com//span/ppbr//pp style="text-align: center text-indent: 2em "strongAlphaFold2 是个大突破,但我们还有努力的方向/strong/ppbr//pp style="text-align: center text-indent: 2em "张阳/pp style="text-align: center text-indent: 2em "(ITASSER 创造者,美国密歇根大学教授)/ppbr//pp style="text-indent: 2em "AlphaFold2 显然是蛋白质结构预测领域的重大突破。这可能是从 1969 年第一篇 Journal of Molecular Biology 用比较建模方法预测蛋白质结构发表 51 年以来最大的突破。/ppbr//pp style="text-indent: 2em "这个领域过去 20 年来,进展一直比较缓慢,但最近几年,随着共同进化、接触图预测以及引入深度学习之后,很多软件,比如 I-TASSER 和 Rosetta 等,都有了很大进步。/ppbr//pp style="text-indent: 2em "就 I-TASSER 来讲,两年前在第 13 届 CASP(CASP13)时,它能够正确预测的非同源蛋白数目比其六年前在 CASP11 上提高了 5 倍。这次 CASP14 也比 CASP13 的预测能力提高了很多。但 AlphaFold2 这次比上次进步更大,和两年前的上一个版本相比, AlphaFold2 的主要变化是直接训练蛋白质结构的原子坐标,而不是用以往常用的、简化了的原子间距或者接触图。/ppbr//pp style="text-indent: 2em "传统上,蛋白质结构预测可以分成基于模板和从头预测,但是 AlphaFold2 只用同一种方法 —— 机器学习,对几乎所有的蛋白质都预测出了正确的拓扑学的结构,其中有大约 2/3 的蛋白质预测精度达到了结构生物学实验的测量精度。这说明,至少是在单结构域的蛋白结构,他们接近解决了这个问题。/ppbr//pp style="text-indent: 2em "谷歌这次为什么能够取得如此大的成功?/ppbr//pp style="text-indent: 2em "这首先与它们拥有强大的人力和计算资源有关。/ppbr//pp style="text-indent: 2em "计算机上,他们使用 TPU(据他们的宣传是比 GPU 快 15 倍),学术界的实验室只有 CPU 或者 GPU,而很多实验室都还没有 GPU。他们对媒体宣传中说 Alphafold2 最后只用相当于 100 个 GPU 的资源训练了两周就产生了最后的模型,学界大多数实验室都可以做到,这是不客观的。因为产生一个新的想法,到训练成功的模型,中间起码要反复测试重复 100 次甚至 1000 次。这就像吃了十个馒头的饿汉一 样,不能说吃了最后一个馒头吃饱了,就觉得只吃最后一个馒头就够了。/ppbr//pp style="text-indent: 2em "另外,他们可以高薪招聘大量专业人才,集中精力攻关一件事,不需要担心基金申请、教学和学生毕业论文等等。这些人力和计算资源上的差别是谷歌 DeepMind 这样的工业研究机构比起学术界在攻关科学或者工程问题上的最大优势。/ppbr//pp style="text-indent: 2em "当然,学术界在蛋白质结构预测这么多年的积累,也给 AlphaFold2 的成功奠定了基础。/ppbr//pp style="text-indent: 2em "我自己很高兴他们取得了这么大突破。这个工作首先证明了蛋白质结构预测问题是可以被解决的。这其实不是一个简单的问题,因为蛋白质结构和序列的复杂关系,常常让人们 —— 特别是做结构预测的人 —— 怀疑,蛋白质折叠这个问题是不是可解, 或者有没有唯一解。/ppbr//pp style="text-indent: 2em "我们在 15 年前的一篇 PNAS 论文中提到,用 PDB 库中的模板,在理论上可以解决 “单结构域蛋白质结构预测” 这个问题,但那是一个基于模板的传统解法, 难点是如何找到最好的模板。谷歌他们这次用「暴力」的机器学习,「暴力」地解决了这个问题。这个做法的成功会对很多相关领域都产生深远影响。/ppbr//pp style="text-indent: 2em "有人说这个 AlphaFold2 会让很多相关行业的人失业。我认为恰恰相反,它给很多领域提供了解决问题的新途径和新思维,因而会极大推动相关领域的发展,因此会产生更多更大的机会。即便是在蛋白质结构预测这个相对较小的领域,我们还有很多事情要做。/ppbr//pp style="text-indent: 2em "AlphaFold2 这次只有 2/3 的蛋白预测做到实验精度,还有 1/3 做不到,是否还有更快更好的途径来产生更高精度结构的算法?基于商业或其它考虑,我相信谷歌可能不会公开代码或 Server。/ppbr//pp style="text-indent: 2em "所以,最终可能还得学术界的同行共同努力,完善和推广这一技术,让其真正惠及生物医学研究以及普通公众的健康需求。/ppbr//pp style="text-align: center text-indent: 2em "strong共赢大于竞争/strong/ppbr//pp style="text-align: center text-indent: 2em "龚新奇/pp style="text-align: center text-indent: 2em "(中国人民大学数学科学研究院教授,清华大学北京结构生物学高精尖中心合作研究员)/ppbr//pp style="text-indent: 2em "2020 年第 14 届国际蛋白质结构预测竞赛(CASP14)共有 84 个常规(Regular)题目,其中有 14 个题目因为生物实验没给出确定结构等原因被取消或延缓,其他 70 个题目的单体和复合物蛋白质所含有的氨基酸个数从 73 到 2180 不等。/ppbr//pp style="text-indent: 2em "19 个国家的 215 个小组参加了 CASP14。最终,谷歌旗下 DeepMind 公司的人工智能系统 AlphaFold2 在 2018 年的 Alphafold 基础上迭代创新,超常发挥,一枝独秀,基本解决了「从氨基酸序列预测蛋白质结构」这个困扰人类 50 年的生物学第二遗传密码问题。/ppbr//pp style="text-indent: 2em "AlphaFold2 的成功表现在三个方面:/pp style="text-indent: 2em "1.不少结构的预测精确度跟实验晶体结构相当,可以替代晶体结构;br//pp style="text-indent: 2em "2.一些含有多个结构域的复杂超长的单链结构也达到了可以跟实验结构比较的程度;/pp style="text-indent: 2em "3.帮助解析了竞赛中涉及到的、实验多年没拿到的 X 射线晶体和 cryo-EM 冷冻电镜结构,比如 T1058 的膜蛋白是用了 Alphafold2 的预测模型之后,才跟原有晶体学数据综合成功解析了结构。br//pp style="text-indent: 2em "AlphaFold2 团队的 John Jumper 报告表明,他们使用了基于注意机制的神经网络,动态调整网络中节点的顺序和链接;依靠的是端到端的优化整体构建结构,而不是氨基酸距离;网络中内置了大量的序列、结构和宏基因组等多重比较信息;还依赖分子模拟软件优化去掉了原子的堆积碰撞。/ppbr//pp style="text-indent: 2em "在 AlphaFold2 的摘要作者名单里,交叉团队的 30 位作者中有 19 位都被标记为相同贡献的第一作者。他们将近 8 分钟的宣介视频,记录了团队成员在新冠疫情期间精诚合作、攻坚克难的宝贵场景。/ppbr//pp style="text-indent: 2em "CASP 组织者 John Moult 指出,计算下一步还有更困难的问题要解决:超大复合物结构、动态构象变化、蛋白质设计、药物设计等等。/ppbr//pp style="text-indent: 2em "除了我们蛋白质结构预测小同行对 AlphaFold2 的成功很欣喜之外,社会上还有多个不同方向的学术界、产业界和新闻界对它寄予了厚望。/ppbr//pp style="text-indent: 2em "在欣喜的同时,蛋白质结构预测小同行也有一些保留意见:/pp style="text-indent: 2em "1.工程化明显,依赖于强大的 GPU 计算资源和代码优化团队;br//pp style="text-indent: 2em "2.谷歌公司几乎可以收集全球所有网络信息,虽然看起来 AlphaFold2 的自动化程度很高,但他们在人工操作中使用了哪些信息值得关注;/pp style="text-indent: 2em "3.预测对了结构,但不等于明白了蛋白质折叠过程和原理。/ppbr//pp style="text-indent: 2em "strong生物实验科学家也有不少看法:/strong/pp style="text-indent: 2em "1.算出结构只是生物学规律发现的第一步;/pp style="text-indent: 2em "2.计算的多个 models 中,有时打分排序不准;/pp style="text-indent: 2em "3.开放 AlphaFold2 的 server 之后,使用效果不一定那么好;/pp style="text-indent: 2em "4.只是在已有蛋白质结构数据集上训练得到的模型,尚不能计算其它构象或其它类别的分子结构。/pbr/p style="text-indent: 2em "还有关心这个领域的其他方向的专家也提出了问题:怎么理解这个算法成功的原理?怎么跟原有的热力学、物理学等基本原理相融相通?/ppbr//pp style="text-align: center text-indent: 2em "我认为 AlphaFold2 是个大突破,后续可能性很多,会替代一些简单的结构生物学实验,但对当下科学家追求的前沿生物学来说,共赢大于竞争;对生物学、数学和计算机学等学科而言,则会带来新的机遇。br/br/strong技术服务于科学探索,结构生物学早就进入新时代/strongbr/颜宁/pp style="text-align: center text-indent: 2em "(美国普林斯顿大学雪莉?蒂尔曼终身讲席教授,美国科学院外籍院士)/ppbr//pp style="text-indent: 2em "首先,简单说一下,什么是生物学里的「结构」。/pbr/p style="text-indent: 2em "用个不太恰当的类比:变形金刚。比如擎天柱是辆车还是个机器人,这就是不同的结构了,机器人能打架大车做运输,功能也不一样。而不同的汽车人组成成分可能差不多,都有合金、玻璃、橡胶,但是形态各异,特长也不一样。br/生物分子的组成成分和基本单元就那么几种,但是组装起来,不同的序列不同的结构,于是功能各异、五花八门。这个结构不是静止的,每一个生物大分子基本都像个小机器,比变形金刚更复杂、更变化多端。/ppbr//pp style="text-indent: 2em "因为结构决定了生物大分子的功能,所以解析高分辨率结构在过去几十年一直是理解生物大分子工作机理最有力的工具。但是一直以来,因为技术局限,对于绝大多数生物大分子的结构解析困难重重。所以,一批科学家另辟蹊径,试图在已有的知识基础上,绕开劳心劳力又劳财的实验步骤,从蛋白质的序列直接通过计算预测出它们精准的三维结构。/ppbr//pp style="text-indent: 2em "蛋白结构预测并不是一个新鲜学科,一直以来就是结构生物学的一个分支,很多科学家不断开发算法,希望根据序列预测出来的结构越来越准确。br/这个领域在过去十几年进步迅速,并且与实验结构生物学融合度越来越高。比如,自从进入电镜时代,看到一堆黑白灰的密度,如果其中某些部分没有同源结构,通过软件预测一个大致的结构模型,放到密度图里面做框架,再根据实验数据调整,已经是个常规操作。/ppbr//pp style="text-indent: 2em "这次人工智能赢得 CASP 的新闻亮点有两个,一是 AI,二是准确度高。这确实是突破,但是有了两年前的新闻(注:2018 年,DeepMind 开发的第一代 AlphaFold 首次参加 CASP 并且拔得头筹)做铺垫,现在这次委实是意料之中。br/至于衍生出来的所谓「结构生物学家都要失业了」的调侃 —— 如果你对结构生物学的理解还停留在 20 年前,那这么说也不是不行。但是结构生物学自身一直在发展着,一场冷冻电镜的分辨率革命更是令结构生物学不同往日了。br/我在 2015 年主持一个学术研讨会的时候曾经评论过:结构生物学的主语是生物学,是理解生命、是做出生物学发现。br/但是,在 X - 射线晶体学为主要手段的时代,获得大多数研究对象的结构本身太难了,于是很多研究者把「获得结构」本身作为了目标,让外行误以为结构生物学就是解结构。但我从进入这个领域之初,就被教育得明明白白:结构本身只是手段,它们是为了回答问题、做出发现。而电镜使得「发现」二字尤为突出。br/br/看到结构本身、知道你的研究对象长啥样,倒也可以称之为发现,但我刚刚说的「发现」,特指那些超乎想象的、通过结构才揭示出来的、自然界里神奇的存在或者令人叹为观止的机理。/pbr/p style="text-indent: 2em "我讲课最喜欢举的例子之一就是施一公组的剪接体结构。为啥呢?因为它集合了结构生物学发现里几乎所有的精彩要素和挑战。br/br/第一,在剪接体结构出来之前,有很多剪接体的组分甚至是未知的。不同于传统的结构生物学,先知道你要研究对象是啥,再吭哧吭哧地去把它们的结构解出来 —— 剪接体的电镜分析是看到了密度图之后,完全不晓得这是啥,需要通过质谱等手段去鉴定组分。我从 2015 年就预测:电镜与质谱组合,将会变成一个重要的生物学研究发现手段。在电镜时代,这样的例子越来越多。比如清华大学隋森芳老师组的那个巨大的藻胆体结构,靠质谱都不够了。为了搞明白组分,他们甚至先做了基因组测序。br/br/第二,几十上百个蛋白如何众星捧月地把那么几条貌似简单的 RNA 掰成与几个小小的金属离子配合的核酶反应中心,在茫茫碱基中,在正确的时间正确的地点牵线搭桥,剪掉 intron(内含子),连接 exon(外显子)?就为了这一「剪子」 一「钩针」,为了几毫秒的过程,这么个庞然大物的几十上百个组成部件却要分分合合,这个过程是真神奇。/ppbr//pp style="text-align: center text-indent: 2em "img style="max-width:100% max-height:100% " src="https://img1.17img.cn/17img/images/202012/uepic/72bc97e7-d254-461b-b199-1156f73a37c8.jpg" title="微信图片_20201204191624.jpg" alt="微信图片_20201204191624.jpg"//pp style="text-align: center text-indent: 2em "span style="font-size: 12px "施一公实验室报道的首个酵母剪接体的结构/span/pp style="text-align: center text-indent: 2em "span style="font-size: 12px "(图源:生物化学经典教材 Lehninger Principles of Biochemistry(第七版)封面)/span/pp style="text-align: center text-indent: 2em "span style="font-size: 12px "br//span结构生物学目前的实验手段只能获得静止的 3D 照片,为了揭示这部电影,就要不断获得中间态的 3D 照片,帧数越多,电影越精准。但即便如此,这个过程中的动力学问题,简单说,就是变化速度,依旧不是现在的结构生物学实验手段可以揭示的,需要借助更多生物物理技术、计算生物学手段去探索。br/我自己的工作虽然没有剪接体那么酷炫,但是电压门控钠离子通道如何感受膜电势的变化,开门关门,就这么个过程,听着简单,我们死磕三年了,依旧束手无策。另外,我们今年发的两篇 PNAS 论文其实代表了结构生物学的另一个努力方向:在实验操作过程中对生物大分子施加外力(电场、磁场、各种长度的波......)。br/也许是受到我自身专业领域的局限,AlphaFold 迄今带给我的震撼还赶不上冷冻电镜的革命,后者将我们从技术挣扎中解放出来,可以专注于结构带来的生物学发现本身。br/br/AlphaFold 目前最成功的预测是针对单链分子,当然将来预测复合物的高精结构也应该不在话下。相比于对蛋白折叠的贡献,我倒是更希望 AI 能够助力 Molecular Dynamics Simulation(分子动力学模拟)。对结构生物学而言,这个领域才是亟需进步的。br/br/我个人认为生命是地球上最神奇的存在,那么多未知要探索,任何一次技术进步都是契机。该考虑的是如何把新技术为我所用,去问出、去探索更有意思的问题。br/最后,当 AI 能够成功预测我们正在孜孜以求的生物大分子动态、原位高分辨率结构的时候,那失业的一定不止是结构生物学家、或者生物学家了 :pbr/br/strong各抒己见/strong/pp style="text-indent: 2em "strongbr//strong根据现在披露的结果,AlphaFold2 已经基本达到实验解析结构的精度。前天 AlphaFold2 团队的报告展示了新冠病毒 SARS-COV-2 的预测结果,说明 RNA 聚合酶这么大的蛋白也能基本预测准确。/pbr/p style="text-indent: 2em "理论上,这会对结构生物学有很大冲击,尤其是以后单颗粒 cryo-EM 的实验方法上,是否还需要把分辨率做得那么高?低分辨率的电子密度图,甚至 SAXS 数据结合预测结果应该就能解决问题了。br/但是,现实中的冲击不会那么大。这是因为,AlphaFold2 模型的创新性非常高,其中结合的 2D transformer 和 3D equivariant transformer 都是 AI 领域的前沿技术,模型的训练难度很大。/pbr/p style="text-indent: 2em "DeepMind 的训练方法在学术界很难复现,估计学术界要花几年的时间才能跟上,因此短期内 AlphaFold2 对结构生物学的影响会比较有限。DeepMind 可能会和个别实验室合作,预测蛋白质结构。/pbr/p style="text-align: right text-indent: 2em "—— 龚海鹏(计算生物学家,清华大学结构生物学高精尖创新中心研究员)/pbr/br/p style="text-indent: 2em "AlphaFold 为结构生物学家提供了除晶体学、冷冻电镜、NMR 以外的另外一种手段,用于揭示生物大分子发挥作用的分子机制。/pbr/p style="text-align: right text-indent: 2em "—— 张鹏(结构生物学家,主要利用晶体学和冷冻电镜技术;中科院分子植物科学卓越创新中心研究员)/pbr/br/p style="text-indent: 2em "AlphaFold 目前还不能预测复杂的分子机器,主要是因为蛋白 - 蛋白相互作用非常复杂,存在极多的可能性。实验手段所揭示出来的蛋白 - 蛋白相互作用方式还只是冰山一角,更何况在不同生理条件和过程中的结构变化。因此,未来对有特定功能的、多个成分组成的、生物大分子复合体的结构解析,以及体内的结构分析,将成为结构生物学实验研究的主要内容。无论有没有 AlphaFold,结构生物学也正在朝这个方向发展。/pp style="text-indent: 2em "Rosetta(注:从头蛋白结构建模算法)也好,AI 也罢,结构预测都是基于已有的实验数据够大。没有足够的数据积累,这些基于统计和数据库的预测就无法实现。完全基于物理学和化学第一性原理的结构预测还没有出现。br/实验科学永远是探索未知的必要手段。新的软件算法应该是成为实验科学家的更有力工具,而不是取代实验科学。/ppbr//pbr/p style="text-align: left text-indent: 2em "—— 王宏伟(cryo-EM 专家,清华大学结构生物学高精尖创新中心执行主任,清华大学生命科学学院院长)br/br/br/br/ 最近两年,结构生物学领域经历了与围棋界类似的故事。Alphago Fan 版本时围棋界并不认为它能够战胜人类顶尖高手,可是 Alphago Lee 后整个围棋界甘拜下风,并且转向 AI 拜师学艺。2018 年 Alphafold 出现时,实验结构生物学领域认为被战胜的仅仅是传统的结构预测领域,2020 年 Alphafold2 之后,实验结构生物学领域应该开始思考如何与之共存以及如何「拜师学艺」了。/pp style="text-align: left text-indent: 2em "br/ 目前阶段人工智能在围棋上已经远远超过人类顶尖棋手,但是人类围棋比赛并未因此取消,如同汽车发明后奥林匹克仍然在进行田径比赛一样。原因之一是人工智能虽然超越了人类,但并未解决围棋的最终解。同样的道理,对于复杂的结构生物学问题,预测手段本身还不能号称完全解决了问题。/pp style="text-align: left text-indent: 2em "br/ 实验结构生物学领域接下来需要做的一个事情是要拥抱变化,更好地与预测方法结合以及共同发展。/pbr/p style="text-align: right text-indent: 2em "—— 周强(cryo-EM 专家,西湖大学生命科学学院特聘研究员)/ppbr//ppbr//pp style="text-indent: 2em "蛋白质体系越大,结构的解析越难仅依赖计算方法。Cryo-ET (冷冻电镜断层成像) 技术擅长解析体外难表达的大分子机器结构、细胞中的原位蛋白结构等复杂体系,因此很难被脱离实验手段的方法取代。目前,由于体系过于复杂,使用分子动力学模拟整颗病毒尚未实现,要模拟细菌、细胞、组织,还要很长的路要走。/ppbr//p
  • DeepMind遇上对手? Meta AI预测6亿蛋白质结构
    ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。(图片来源:ESM宏基因组图谱)  英国人工智能(AI)公司DeepMind今年公布了2.2亿个蛋白质的预测结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在,另一个科技巨头正在填补蛋白质宇宙中的暗物质。  美国Meta公司(前身为Facebook)的研究人员使用人工智能预测了约6亿个蛋白质的结构,这些蛋白质来自细菌、病毒和其他尚未被表征的微生物。相关研究11月1日发表于预印本网站BioRxiv。  “这些是非常神秘的蛋白质,为深入了解生物学提供了可能性。”Meta人工智能蛋白质团队研究负责人Alexander Rives说。  该团队使用“大型语言模型”生成了这些预测。“大型语言模型”是一种人工智能,可作为通过几个字母或单词预测文本的工具的基础。  通常语言模型是在大量文本的基础上进行训练的。为了将其应用于蛋白质,Rives团队将已知蛋白质序列“喂”给它们,这些蛋白质由20个不同的氨基酸链表示,每个氨基酸链由一个字母表示。然后,该模型学会了在氨基酸比例模糊的情况下“自动补全”蛋白质。  Rives说,这种训练使模型对蛋白质序列有了直观的理解,蛋白质序列包含了蛋白质形状的信息。  第二步,受DeepMind开创性蛋白质结构人工智能算法AlphaFold的启发,模型将这种洞察力与已知蛋白质结构和序列之间关系的信息相结合,从蛋白质序列中生成预测结构。  今年夏天早些时候,Rives团队报告称,其模型算法名为ESMFold,虽准确性不如AlphaFold,但在预测结构方面要快60倍左右。“这意味着我们可以将结构预测扩展到更大的数据库中。”Rives说。  作为一个测试案例,研究团队决定将模型应用于大规模测序的“宏基因组”DNA数据库,这些DNA来自环境,包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。绝大多数编码潜在蛋白质的DNA条目来自从未被培养过的生物,也不为科学家所知。  Meta团队总共预测了超过6.17亿个蛋白质的结构,这项工作只花了两周时间。Rives表示,预测是免费的,任何人都可以使用,就像模型的底层代码一样。  在这6.17亿个蛋白质结构中,该模型认为超过1/3的预测是高质量的,因此研究人员可以确信蛋白质的整体形状是正确的,在某些情况下,模型可以识别更精细的原子级细节。值得一提的是,其中数以百万计的结构都是全新的,与实验确定的蛋白质结构数据库,或从已知生物体预测的AlphaFold数据库中的结构都不同。  AlphaFold数据库的很大一部分是由几乎相同的结构组成,而宏基因组数据库则涵盖了以前从未见过的蛋白质宇宙的很大一部分。  哈佛大学进化生物学家Sergey Ovchinnikov对ESMFold做出的数亿个预测表示怀疑。他认为,有些蛋白质可能缺乏确定的结构,而另一些可能是非编码DNA,被误认为是蛋白质编码材料。  德国慕尼黑工业大学计算生物学家Burkhard Rost对Meta公司模型的速度和准确性的结合印象深刻。但他质疑,宏基因组数据库预测蛋白质是否真的比AlphaFold的精确度更高。基于语言模型的预测方法,更适合快速确定突变如何改变蛋白质结构,这是AlphaFold无法做到的。  据DeepMind的一位代表说,该公司目前没有在其数据库中进行宏基因组结构预测的计划,但不排除在未来这样做的可能性。  韩国首尔国立大学计算生物学家Martin Steinegger认为,利用这类工具的下一步,显然是研究生物学中的暗物质。“这些宏基因组结构的分析很快就会出现爆炸式增长。”  相关论文信息:  https://doi.org/10.1101/2022.07.20.500902
  • 基于镜像酶正交酶切的蛋白质复合物规模化精准分析新方法
    蛋白质作为生命活动的执行者,通过自身结构的动态改变,以及与其他蛋白质相互作用组装为蛋白质复合物,调控各种生物学过程。因此,如何实现蛋白质复合物的精准解析已成为当前生命科学的研究热点。化学交联结合质谱(CXMS)技术作为蛋白质复合物解析的新兴技术,利用化学交联剂将空间距离足够接近的蛋白质分子内或分子间的氨基酸残基以共价键连接起来,再利用液相色谱-质谱联用对交联肽段进行鉴定,实现蛋白质复合物的组成、界面和相互作用位点的解析。该技术具有分析通量高、灵敏度高、可提供蛋白质间相互作用的界面信息、普遍适用于不同种类和复杂程度的生物样品等优势,已成为X射线晶体衍射、低温冷冻电镜、免疫共沉淀等蛋白质复合物研究技术的重要补充。化学交联位点的鉴定覆盖度和准确度决定着该技术对于蛋白质复合物结构的解析能力。目前,为了实现蛋白质复合物的高覆盖度交联,研究人员发展了可用于共价交联赖氨酸(K)的氨基、谷氨酸(E)/天冬氨酸(N)的羧基、精氨酸(R)的胍基以及半胱氨酸(C)的巯基等多种活性基团的新型交联剂。进而,为了提高低丰度交联肽段的鉴定灵敏度,体积排阻色谱法、强阳离子交换色谱法,及亲和基团富集策略被提出用于交联肽段的高选择性富集,如可富集型化学可断裂交联剂——Leiker,与不具备富集功能的交联剂相比,通过亲和富集可以将交联位点鉴定数目提高4倍以上。胰蛋白酶镜像酶(LysargiNase)的酶切位点与胰蛋白酶互为镜像,可特异地切割赖氨酸和精氨酸的N端。由于LysargiNase的N端酶切特点,电荷主要分布在交联肽段的N端,在碰撞诱导裂解(CID)和高能诱导裂解(HCD)模式下产生以b离子为主的碎片离子,与胰蛋白酶酶切肽段以y离子为主的碎片离子互为镜像补充,为胰蛋白酶酶解肽段在质谱鉴定中b离子缺失严重的问题提供了很好的解决办法。由于具有较高的酶切特异性和酶活性,镜像酶已经成功地应用于蛋白质C末端蛋白质组鉴定、磷酸化蛋白质组研究、甲基化蛋白质组鉴定等方面,然而在CXMS中的应用仍未见报道。为进一步提高对蛋白质复合物结构及相互作用位点的解析能力,本文发展了LysargiNase与胰蛋白酶联合酶切的方法,基于镜像酶正交切割的互补特性,通过产生赖氨酸及精氨酸镜像分布的交联肽段,以增加特征碎片离子数量和肽段匹配连续性,从而提升交联肽段的谱图鉴定质量,达到提高交联位点的鉴定覆盖度和准确度的目的。通过分别对牛血清白蛋白及大肠杆菌全蛋白样品的交联位点鉴定结果的考察,评价该策略对单一蛋白样品和复杂细胞裂解液样品蛋白质复合物表征的应用潜力。蛋白质样品制备称取牛血清白蛋白粉末,以20 mmol/L 4-(2-羟乙基)-1-哌嗪乙磺酸(HEPES, pH 7.5)作为缓冲体系,配制0.1 mmol/L牛血清白蛋白溶液。大肠杆菌细胞(种属K12)在37 ℃下采用Luria-Bertani(LB)培养基培养24 h,然后于4 ℃以4000 g离心2 min,收集细胞沉淀。细胞沉淀采用磷酸盐缓冲液(PBS)清洗3遍后,悬浮于细胞裂解液(含20 mmol/L HEPES和1%(v/v)蛋白酶抑制剂)中,冰浴超声破碎180 s(30%能量,10 s开,10 s关)。匀浆液于4 ℃以20000 g离心40 min,收集上清,采用BCA试剂盒测定所得蛋白质含量。稀释大肠杆菌蛋白裂解液至蛋白质含量为0.5 mg/mL。化学交联样品制备以20 mmol/L HEPES(pH 7.5)为溶剂配制浓度为20 mmol/L 的BS3交联剂母液 将交联剂母液加入牛血清白蛋白的缓冲溶液及大肠杆菌蛋白裂解液中,使交联剂的终浓度为1 mmol/L,在室温条件下反应15 min 通过添加终浓度为50 mmol/L的淬灭溶液NH4HCO3进行交联反应淬灭,并在室温下孵育15 min 在冰浴条件下,将交联样品逐渐滴入8倍体积的预冷丙酮中,于-20 ℃静置过夜 在4 ℃条件下,以16000 g转速离心,去除丙酮,然后将交联蛋白用预冷丙酮清洗2次,去除上清液后,于室温挥发掉残余的丙酮 以8 mol/L尿素溶液复溶蛋白质沉淀 将牛血清白蛋白交联样品以5 mmol/LTCEP作为还原剂,于25 ℃下反应1 h进行变性和还原 将大肠杆菌样品以5 mmol/LDTT作为还原剂,于25 ℃下反应1 h进行变性和还原,避免大肠杆菌蛋白在酸性条件下发生变性 添加终浓度为10 mmol/L的碘乙酰胺(IAA),在黑暗中,于室温下反应30 min 以50 mmol/LNH4HCO3稀释样品至尿素浓度为0.8 mol/L后,将样品均分为两份,一份以蛋白样品与蛋白酶的质量比呈50:1的比例加入胰蛋白酶,于37 ℃酶解过夜,另一份加入终浓度为20 mmol/L的CaCl2,以蛋白样品与蛋白酶的质量比呈20:1的比例加入LysargiNase,并在37 ℃温度下酶解过夜。液相色谱-质谱鉴定及数据搜索上述所有样品经过除盐,使用0.1%甲酸(FA)溶液复溶,用超微量分光光度计测定肽段浓度,进行反相高效色谱分离和质谱分析。牛血清白蛋白样品采用Easy-nano LC 1000系统偶联Q-Exactive质谱仪平台进行质谱分析。流动相A: 2%(v/v)乙腈水溶液(含0.1%(v/v)FA) 流动相B: 98%(v/v)乙腈水溶液(含0.1%(v/v)FA)。梯度洗脱程序:0~10 min, 2%B~7%B 10~60 min, 7%B~23%B 60~80 min, 23%B~40%B 80~82 min, 40%B~80%B 82~95 min, 80%B。Q-Exactive质谱仪采用数据依赖性模式,Full MS扫描在Orbitrap上实现,扫描范围为m/z 300~1800,分辨率为70000(m/z=200),自动增益控制(AGC)为3×106,最大注入时间(IT)为60 ms,母离子分离窗口为m/z 2。MS/MS扫描的分辨率为17500(m/z=200),碎裂模式为HCD,归一化碰撞能量(NCE)为35%, MS2从m/z 110开始采集,MS2的AGC为5×104, IT为60 ms,仅选择电荷值为3~7且强度高于1000的母离子进行碎裂,并将动态排除时间设置为20 s。每个样品分析3遍。大肠杆菌样品采用EASY-nano LC 1200系统偶联Orbitrap Fusion Lumos三合一质谱仪平台进行质谱分析。流动相A: 0.1%(v/v)甲酸水溶液 流动相B: 80%(v/v)乙腈水溶液(含0.1%(v/v)FA)。梯度洗脱程序:0~28 min, 5%B~16%B 28~58 min, 16%B~34%B 58~77 min, 34%B~48%B 77~78 min, 48%B~95%B 78~85 min, 95%B。Orbitrap Fusion Lumos三合一质谱仪采用数据依赖性模式,Full MS扫描在Orbitrap上实现,扫描范围为m/z 350~1500,分辨率为60000(m/z=200), AGC为4×105, IT为50 ms,母离子分离窗口为m/z 1.6。MS2扫描的分辨率为15000(m/z=200),碎裂模式为HCD, NCE为30%, MS2从m/z 110开始采集,MS2的AGC为5×104, IT为60 ms。仅选择电荷值为3~7且强度高于2×104的母离子进行碎裂,并将动态排除时间设置为20 s。每个样品分析3遍。质谱数据文件(*.raw)采用pLink 2软件(2.3.9)对交联信息进行检索和鉴定。使用从UniProt于2019年4月27日下载的牛血清白蛋白序列和大肠杆菌序列,搜索参数如下:酶切方式为胰蛋白酶(酶切位置:K/R的C端)、LysargiNase(酶切位置:K/R的N端) 漏切位点个数为3 一级扫描容忍(precursor tolerance)2.00×10-5 二级扫描容忍(fragment tolerance)2.00×10-5 每条肽段的质量范围为500~1000 Da 肽段长度的范围为5~100个氨基酸 固定修饰为半胱氨酸还原烷基化(carbamidomethyl [C]) 可变修饰为甲硫氨酸氧化(oxidation [M])、蛋白质N端乙酰化(acetyl [protein N-term]) 肽段谱图匹配错误发现率(FDR)≤5%。映射胰蛋白酶与LysargiNase酶解样品的交联位点在牛血清 白蛋白晶体结构(PDB: 3V03)的映射 LysargiNase与胰蛋白酶酶解样品的交联位点对及单一交联位点的互补性LysargiNase与胰蛋白酶酶解样品共同得到的交联位点鉴定打分比较b+/++与y+/++离子碎片分别在α/β-肽段的碎片覆盖度LysargiNase与胰蛋白酶酶解的交联肽段质谱图大肠杆菌样品中LysargiNase与胰蛋白酶酶切鉴定蛋白质复合物信息互补性带点击了解原文:https://www.chrom-china.com/article/2022/1000-8713/1000-8713-40-3-224.shtml
  • 蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码
    蛋白质是生命的物质基础,每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构,想要破解这种结构通常需要花很长的时间,甚至难以完成。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。  但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关。在蛋白质结构解析的几十年历史中,X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献,但这些技术在科学界看来,都有着劳心劳力又价格高昂的缺点。  如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题,了解生命运作方式的将打开截然不同的一扇窗。这种设想提出的50多年后,谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅,他们开发的基于神经网络的新模型AlphaFold2击败了其他选手,在预测准确性方面达到接近人类实验结果,让整个结构生物学界震惊。北京时间7月15日,DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文,全面详述了半年前造成轰动的这一模型,并首次对外分享开源代码。该论文于今年5月11日提交,7月12日被接收。  DeepMind团队提供了一份声明,公司创始人兼首席执行官Demis Hassabis在声明中表示,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。  “今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”Hassabis表示。值得一提的是,就在同一天,另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章,题为“Accurate prediction of protein structures and interactions using a three-track neural network”。  来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold,其拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。同样,研究团队也对外分享了开源代码。该论文提交于6月7日,7月7日被接收。  清华大学生命科学学院院长、高精尖中心执行主任王宏伟表示,“高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的。”他评价道,对于DeepMind这样一家商业公司来说,“团队愿意向公众分享代码,是一个新型科研范式的突破,将整体上有利于人类更好地探索未知。”  预测蛋白质结构,接近实验室测量  50多年前,科学家们就设想用计算机预测蛋白质结构。近年来,共同演化、接触图预测、深度机器学习等技术的引入,一些实验室的算法精度有了很大程度的提高。  曾经开发出Alphago、战胜人类顶尖棋手的DeepMind团队是其中的佼佼者,其团队的强大和资源雄厚是一般实验室无法企及的。2020年12月1日,他们在生物领域展现出实力,在两年一度的权威蛋白质结构预测评估竞赛(CASP)中用AlphaFold2击败其他参赛团队。  CASP是由马里兰大学John Moult教授等人于1994年组织。竞赛使用的是最新解决且尚未在蛋白质数据库(PDB)中存放或公开披露的结构,结构生物学家们利用X射线晶体学、核磁共振波谱学、冷冻电镜的方法,把这些蛋白质的结构解析出来。做蛋白质结构预测的团队则利用计算机程序来预测它们的结构。最后由独立的科学家团队则把计算机预测的模型和实验室的结构对照,分析不同计算机算法的预测结果。这是一种“双盲”测试,长期以来一直是评价结构预测准确性的金标准。  去年的CASP14共有84个常规题目,其中有14题因为生物实验没给出确定结构等原因被取消或延缓,其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。  19个国家的215个小组参加了CASP14。DeepMind公司的AlphaFold2预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在AlphaFold2的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。  AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。  AlphaFold2最终被Moult评价道,“在某种意义上,问题已经解决了”。  值得一提的是,在最新发布的论文中,DeepMind还简化了AlphaFold2。AlphaFold的首席研究员John Jumper说,“这个网络需要几天的计算时间来生成CASP的一些蛋白质的结构,而开源版本的速度要快16倍。根据蛋白质的大小,它可以在几分钟到几小时内生成结构。”  受AlphaFold2的启发,华盛顿大学医学院生物化学家、蛋白质设计研究所所长David Baker等人开发了RoseTTaFold。华盛顿大学医学院官网对该研究的介绍称,在高精度的蛋白质结构预测方面,Baker等人“在很大程度上重现了DeepMind团队的表现。”  相较于AlphaFold2只解决了单个蛋白质的结构,RoseTTaFold不仅适用于简单的蛋白质,也适用于蛋白质复合物。据介绍,RoseTTaFold利用深度学习技术,根据有限信息准确、快速地预测蛋白质结构。从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得网络能够集中推理蛋白质的化学部分与它的折叠结构。巴塞尔大学的计算结构生物学家Torsten Schwede对《科学》杂志说,许多生物功能依赖于蛋白质之间的相互作用。“直接从序列信息中处理蛋白质-蛋白质复合物的能力使其对生物医学研究中的许多问题极具吸引力。”  Baker同时坦言,AlphaFold2的结构更加准确。但是根特大学的结构生物学家Savvas Savvides说,Bake实验室的方法更好地捕捉到了“蛋白质结构的本质和特性”,比如识别从蛋白质侧面伸出的原子串,这些特征是蛋白质之间相互作用的关键。  纽约大学医学院的细胞和结构生物学家Gira Bhabha说,两种方法都很有效。她表示,“DeepMind和Baker实验室的进展都是惊人的,将改变我们利用蛋白质结构预测推进生物学的方式。”  开源代码,如何促进整个科学界?  相比于去年年底带来的震撼,这次外界更感兴趣的是上述两支团队开源代码这一动作。  此前的6月中旬,在Baker实验室发布RoseTTAFold预印本三天之后,DeepMind的Hassabis在推特上表示,AlphaFold2的细节正在接受一份出版物的审查,公司将“为科学界提供广泛的免费访问”。  而从6月1日开始,Baker等人已经开始挑战他们的方法,让研究人员发送来他们最令人困惑的蛋白质序列。加州大学旧金山分校的结构生物物理学家David Agard的研究小组发送了一组没有已知类似蛋白质的氨基酸序列,几个小时内,他的团队就得到了一个蛋白质模型,“这可能为我们节省了一年的工作。”Agard说。  除了免费提供RoseTTaFold的代码外,Baker团队还建立了一个服务器,研究人员可以插入蛋白质序列并得到预测的结构。贝克说,自从上个月推出以来,该服务器已经预测了大约500人提交的5000多种蛋白质的结构。  不过,上述两支团队的源代码都是免费的,但也有观点认为,对于没有技术专长的研究人员来说,它可能还不是特别有用。不过,DeepMind的科学人工智能负责人Pushmeet Kohli表示,DeepMind已经与一些选定的研究人员和组织合作,以预测特定的目标,其中包括总部位于瑞士日内瓦的非营利组织“Drugs for ignored Diseases”。“在这个领域,我们还有很多想做的事情。”  Hassabis提到,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。“今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”  DeepMind团队认为,这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。  Baker团队也提到,“我们希望这个新工具将继续造福整个研究界。”  中国科学院合肥物质科学研究院强磁场科学中心研究员谢灿对澎湃新闻(www.thepaper.cn)记者表示,“总的来说,对学术界来肯定是好事,肯定会促进结构生物学和相关领域的发展。在承认学术贡献的基础上的开放和共享,本来就应该是学术研究最基本的要求。”  结构生物学是谢灿的“老本行”,“我当年花了8年的时间去解析一个蛋白的晶体结构,我能切身体会如果有一个精准预测蛋白结构的算法出现,对结构生物学家意味着什么。”  但他认为,不必要担忧这些算法的出现会让结构生物学家失业,在技术迭代之下,结构生物学这些年受到的冲击太多了,“而事实上,只不过是某一个领域某一个技术在某一个历史阶段更容易出工作出成绩。”谢灿认为,无论再精准的预测,终究也只是预测,“AlphaFold2不是实验,同样也需要实验去证实。”  王宏伟在AlphaFold2刚出现之时也曾评价道,对于复杂的结构生物学问题,预测手段本身还不能号称完全解决了问题。实验结构生物学领域接下来需要做的一个事情是要拥抱变化,更好地与预测方法结合以及共同发展。
  • Science:人类蛋白质图谱分析大进展
    2015年1月23日一期的Science公布了基于人类蛋白质图谱的大分析结果,包括与癌症相关的详细蛋白质图片,血液中蛋白质种类和数量,以及市场上被批准的所有药物所作用的目标蛋白质。 人类蛋白质图谱(The Human Protein Atlas),是由Knut and Alice Wallenberg基金会于2014年11月支持的一个大型跨国研究项目。近期他们又开放了一个以人器官组织为基础的蛋白质图谱数据库。基于1300万个注释的图像,整个数据库涵盖了人体中的所有主要组织和器官的蛋白质分布,也标注了仅表达在特定组织,如脑,心脏或肝脏的蛋白。作为一个开放的数据资源,这个数据库提高了对人类生物学的基本见解,更有望帮助推动新的诊断和药物的开发。 在Science的这篇文章里,"基于组织的人类蛋白质组图谱" 结合基因组学,转录组学,蛋白质组学,以及基于抗体的分析,详细分析了大约20,000个蛋白质编码基因。分析结果表明,蛋白编码基因几乎一半都是普遍表达在所有分析的组织。而有大概的15%的蛋白质编码基因大量表达在一个或几个特定的组织或器官,包括众所周知的组织特异性蛋白质,如胰岛素和肌钙蛋白。睾丸是含有最丰富种类蛋白质的器官,其后是大脑和肝脏。分析结果还表明,大约3000种蛋白质是从细胞中分泌释放的,另有5500种蛋白位于细胞膜结构。 这一蛋白质图分析结果为制药行业的提供了重要信息。研究小组的Uhlé n表示,他们发现了市场上使用的药品有70%的作用目标是分泌或膜结合蛋白。有趣的是,另外30%被发现是作用其他组织和器官,这可能有助于解释药物的一些副作用,并且对未来药物开发提供一定的参考价值。 该数据库已经免费对外开放,网址是www.proteinatlas.org.
  • ​PACTS辅助热蛋白质分析用于肽-蛋白质相互作用研究
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章,PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins。该文章的通讯作者是来自北京蛋白质组学研究中心的贾辰熙和Chen Yali研究员。生物活性肽是一类重要的生物分子,通过与蛋白受体相互作用,参与调控多种生物学进程。研究肽-蛋白相互作用对于理解这些功能分子的调节机制至关重要。目前已开发多种方法用于表征肽-蛋白的相互作用,例如通过引入荧光探针在多肽上来监测蛋白-多肽的相互作用,或者将多肽固定在磁珠或其他载体材料上进行进一步的亲和沉淀。然而以上方法都需要对多肽进行修饰,导致多肽的结构发生改变,进一步影响多肽-蛋白相互作用,产生假阳性结果。细胞热转移变分析(CETSA)和热蛋白质组分析(TPP)作为一种无修饰/无标签技术已被广泛用蛋白-配体相互作用研究。当配体与蛋白结合后,蛋白的热稳定性发生了改变,导致熔解曲线(Melting cure)发生位移。通过监测熔解温度的变化(∆Tm),实现对蛋白-配体相互作用的检测。CETSA以及TPP允许在天然环境下研究分子互作,从而保留了内源性蛋白表达水平、翻译后修饰、局部微环境等生物物理特性。除了改变蛋白质的热稳定性,肽配体与蛋白质受体相互作用还会导致蛋白构象、疏水性和溶剂可及性的改变,一些配体甚至起到生物助溶的作用。所有这些特性的改变会导致研究体系中靶蛋白丰度的变化。这种由肽段配体结合诱导蛋白的丰度改变现象称之为PACTS。而PACTS也可以被合理的利用用于识别与肽段配体结合的靶蛋白。基于此,本文将PACTS与TPP技术相结合用于肽-蛋白质相互作用研究,PACTS可以辅助TPP分析,特别是在TPP分析过程中,由于配体-靶蛋白结合导致靶蛋白丰度降低至质谱检测限以下,无法绘制熔解曲线的情况下,PACTS可以作为另一个重要的监测手段。如图1所示,PACTS辅助TPP分析的实验流程大致如下:将蛋白提取液分成2份,分别与缓冲液(对照组)、肽配体(实验组)孵育,再将孵育后的每组样本等分成10份,在10个不同的温度下加热3 min。加热完成后,离心,收集上清液。利用SDS-PAGE将肽段与蛋白分离并进行胶内酶切。酶切后的肽段随即用TMT 10-plex标记,最后通过LC-MS/LS进行定量分析。将37 °C下对照组、实验组中同一蛋白的丰度变化作为PACTS的衡量指标(蓝框)。将在不同温度下蛋白的相对丰度变化转化为熔解曲线(黑框),实验组相较于对照组,同一蛋白熔解曲线的位移(∆Tm)作为TPP的衡量指标。综合两种方法识别出的靶标蛋白,作为最终的筛选结果。图1. PACTS辅助TPP分析的实验流程图作者首先用标准肽段-蛋白互作对验证了PACTS辅助TPP分析的可行性。如图2所示,右侧为对照组/实验组中靶蛋白在不同温度下丰度变化(Western blot),中间及左侧则是基于Western blot数据生成PACTs以及熔解曲线。对于JIP1-JNK1互作对,PACTS显示没有明显的丰度变化,而熔解曲线则显示发生了位移(图2A)。与之相反的,对于HOXB-AS3-hnRNP A1互作对,PACTS显示出明显的丰度变化,而熔解曲线则由于靶蛋白丰度降至检测限以下而无法绘制(图2B)。以上两个例子都说很好地说明,PACTS和TPP是两种互补的检测手段,使用两种方法同时检测有利用提高结果的准确性。作者还考察了不同细胞环境对蛋白-配体互作的影响(图CD及图EF)。来源于293T细胞的OPRN1与Enkephalin配体互作产生的熔解温度变化为∆Tm= 0.5 °C(图E),而来源于Hippocampus的OPRN1与Enkephalin配体互作产生的熔解温度变化为∆Tm= -14.4 °C(图F)。这个差异可能是由于孵育时不同的微环境造成的。图2. PACTS辅助TPP分析标准肽段-蛋白互作对。随后,作者将PACTS辅助TPP分析应用到组学层面。Aβ肽是淀粉样斑的主要成分,而淀粉样斑块主要存在于阿尔茨海默症(AD)患者的大脑中。在Aβ肽中,Aβ1-42在介导神经毒性和氧化应激中起关键作用。THP-1细胞类似于小胶质细胞,小胶质细胞功能障碍加速了与年龄相关的神经退行性疾病的进展,如AD。作者利用了PACTS辅助TPP分析研究了THP-1细胞中与Aβ1-42肽段相互作用的蛋白。如图3所示,图3A为PACTS结果,共发现37个蛋白在37 °C下有丰度变化。而TPP结果(图3B)则显示66个蛋白熔解曲线发生了位移。PACTS与TPP的结果具有较小的重合,说明两种方法具有互补性。GO分析表明(图3C),大多数与Aβ1-42相互作用的蛋白存在于细胞外泌体、胞质溶胶和细胞膜中。外泌体在AD中充当双刃剑,一方面,外泌体传播有毒的Aβ肽和过度磷酸化的tau遍及整个大脑,并诱导神经元凋亡。另一方面,它们消除大脑中的Aβ肽并促进其降解。了解Aβ肽与外泌体蛋白之间的相互作用有利于更好的开发AD治疗治疗药物。此外,作者用Western blot的方法进一步确认识别出的靶标蛋白(图D-E)。最后,作者用免疫共沉淀的方法进一步证明靶蛋白与Aβ1-42存在相互作用。图3. PACTS辅助TPP分析与Aβ1-42相互作用的蛋白总之,本文开发一种PACTS辅助TPP的分析方法,可用于大规模组学层面肽段-蛋白质相互作用研究。该方法具有无标记、无修饰的优势,无需额外实验,即可在TPP分析的同时获得PACTS信息。该方法也有助于理解多肽-蛋白质复合物相关的分子调控机制,进一步开发新型治疗药物。撰稿:刘蕊洁编辑:李惠琳原文:PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins 参考文献1.Zhao T, Tian J, Wang X, et al. PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins. Anal Chem. 2022 94(18): 6809-6818. doi:10.1021/acs.analchem.2c00581
  • 蛋白质结构研究大装置安家上海
    园区微晶体结构研究站 园区荧光激发细胞分选仪 海科路园区设施 科研人员研究大分子复合体  7月28日上午,全球生命科学领域首个综合性大科学装置——蛋白质科学研究(上海)设施(以下简称“上海设施”)在上海通过国家验收。中国科学院院长白春礼、上海市市长杨雄、国家发改委副主任林念修等出席验收会。  据介绍,作为国家重大科技基础设施项目之一的上海设施,主要围绕蛋白质科学研究的前沿领域和我国生物医药、农业等产业的发展需求,建设高通量、高精度、规模化的蛋白质制取与纯化、结构分析、功能研究等大型装置,实现技术与设备的集成化、通量化和信息化。目前已建成用于蛋白质结构研究的9大技术系统。  验收委员会认为,上海设施建成了国际一流的蛋白质科学研究支撑体系,是全球生命科学领域以各种大型科学仪器和先进技术集成为核心的首个综合性大科学装置,其总体指标达到国际先进水平,部分指标达到国际领先水平。  白春礼表示,建设设施不是最终的目的,吸引全国和全世界的优秀科学家来从事高水平科研工作、产出重大科技成果才是应该致力追求的目标。上海设施要成立设施科技委员会和用户委员会,建立科学民主开放的课题遴选制度,不断扩大设施开放共享。  据统计,上海设施2014年5月开放试运行,截至2015年7月,各系统累计运行5万多小时,共执行用户课题500多个 服务60多家单位,以中科院和高校科研机构为主,覆盖北京、上海、香港等地 同时吸引了一批国际药企和国内外优秀科学家开展前沿课题研究。用户使用上海设施的设备和服务做出了一系列重要成果,有多项研究成果发表在Nature、PNAS等高水平国际学术刊物上。
  • 蛋白质-小分子相互作用分析技术进展与应用——限制性蛋白水解-质谱分析技术
    阐明小分子(包括内源性代谢物和外源性化合物)如何发挥调控作用的关键问题之一是小分子的靶标发现和验证,即蛋白质-小分子相互作用研究。蛋白质与小分子的相互作用模式既有较稳定的共价结合,也有瞬时的弱相互作用。如何灵敏、高效地捕获并解析多种类型的蛋白质-小分子相互作用是分析难点。目前,蛋白质-小分子相互作用的分析策略大致可分为两类:一是靶向相互作用研究,以蛋白质(或小分子)为中心,发现并验证与之相互作用的小分子(或蛋白质);二是非靶向相互作用研究,全面识别多种蛋白质-小分子的相互作用轮廓。应用的具有分析技术包括:表面等离子体共振技术(surface plasmon resonance,SPR)、氢氘交换质谱分析技术(hydrogen deuterium exchange mass spectrometry,HDX MS)、限制性蛋白水解-质谱分析技术(limited proteolysis-mass spectrometry,LiP-MS)、蛋白质热迁移分析技术(cellular thermal shift assay,CESTA)和药物亲和反应靶标稳定性分析技术(Drug affinity responsive target stability,DARTS)等。本期介绍限制性蛋白水解-质谱分析技术(LiP-MS)的原理、技术流程和其在蛋白质-小分子相互作用研究中的应用。1. 原理LiP-MS技术最初由瑞士苏黎世联邦理工学院的Paola Picotti课题组建立 [1] :利用小分子结合蛋白后相较于原蛋白产生蛋白质空间构象和位阻的变化,经蛋白酶切后形成差异肽段,液质联用分析识别和鉴定差异肽段,基于差异肽段推测蛋白质与小分子的相互作用位点。2. 技术流程在非变性条件下提取蛋白,以保留蛋白活性和空间结构。先使用低浓度(1:100, w/w)蛋白酶K在较低温度(25℃)下短时间内(5 min)对蛋白-小分子复合物进行有限的蛋白酶切。蛋白与小分子结合后,相互作用位点存在空间位阻,从而避免被蛋白酶K切割,由此产生差异肽段。随后进行蛋白变性和胰酶酶切,蛋白质组分析识别和鉴定差异肽段,基于差异肽段所处位置预测蛋白质与小分子的相互作用位点(图1)。图1 限制性蛋白水解-质谱分析(LiP-MS)技术流程 [2]3. 试验试剂和分析仪器3.1 蛋白抽提:可依据实际目的和细胞类型选择不同的细胞/组织裂解液,如RIPA、N-PER、M-PER等,进行细胞/组织蛋白抽提,获得的细胞/组织全蛋白提取物可直接与目标小分子共孵育。3.2 蛋白酶切:关键的蛋白酶切试剂,例如蛋白酶K、胰酶等均有市售。3.3 分析仪器:目前多种类型的液相色谱-高分辨质谱联用仪均可用于蛋白质组学分析,已应用于LiP-MS的高分辨质谱仪包括,布鲁克、赛默飞、沃特世和SCIEX等品牌的飞行时间质谱、轨道阱质谱和傅里叶变换离子回旋共振质谱等。4. 应用实例研究人员基于LiP-MS技术在大肠杆菌中探索多种内源性代谢物和蛋白的相互作用模式 [1],先采用凝胶过滤法除去大肠杆菌全蛋白提取物中的内源性代谢物,获得大肠杆菌全蛋白;随后将大肠杆菌蛋白与20个中心碳代谢相关的关键内源性代谢物(三磷酸腺苷、二磷酸腺苷、烟酰胺腺嘌呤二核苷酸、磷酸烯醇式丙酮酸、6-磷酸葡萄糖、果糖-1,6-二磷酸、丙酮酸、谷氨酰胺、甲硫氨酸等,见图2A)分别共孵育。基于LiP-MS流程发现,上述20个内源性代谢物可与大肠杆菌中1678个蛋白发生潜在相互作用,其中1447个相互作用是首次发现的(图2B)。作者将所发现的相互作用与在线数据库BRENDA对比(主要涉及酶的功能和代谢通路等信息),证明LiP-MS技术能够准确地识别已报道的蛋白-内源性代谢物相互作用,假阳性率低于6 %。图2 20个与中心碳代谢相关的关键内源性代谢物(图A)及其在大肠杆菌中发生相互作用的蛋白数量(图B)[1]参考文献:[1] Piazza, I., Kochanowski, K., Cappelletti, V., Fuhrer, T., Noor, E., Sauer, U., Picotti, P. A map of protein-metabolite interactions reveals principles of chemical communication. Cell, 2018, 172(1-2), 358-372.[2] Pepelnjak M, Souza N D, Picotti P. Detecting Protein–Small Molecule Interactions Using Limited Proteolysis–Mass Spectrometry (LiP-MS). Trends in Biochemical Sciences, 2020, 45(10), 919-920.
  • 定量蛋白质组学方法应用于病毒结构、功能及感染机制研究
    p style="text-align: justify text-indent: 2em line-height: 1.75em "病毒是一种特殊的生命形式,与人类的疾病和健康都密切相关。在一些情况下,某些病毒会侵染人体,导致一系列的疾病,甚至危及生命。对病毒的防控,我们可以通过了解病毒的特点与传播规律,阻止病毒传播;也可以通过研发相应的疫苗来提前预防病毒的感染,而这些工作都需要对病毒有深入的认识和了解。SCIEX面向全球提供不同类型的高端质谱平台和多组学研究方案,能够在基础研究、临床诊疗和药物研发的领域助力对于病毒相关的研究与防控。/pp style="text-align: center text-indent: 2em line-height: 1.75em "span style="color: rgb(0, 112, 192) "strong基于iTRAQ试剂的定量蛋白质组学揭示相似病毒的结构和功能差异/strong/span/pp style="text-indent: 2em line-height: 1.75em "span style="color: rgb(0, 112, 192) "strong/strong/span/pp style="text-align: center"img style="max-width:100% max-height:100% " src="https://img1.17img.cn/17img/images/202004/uepic/dec9490a-bd41-4d1e-9bd3-67dc8f2d04d3.jpg" title="11111.jpg" alt="11111.jpg"//pp style="text-indent: 2em line-height: 1.75em text-align: center "span style="text-align: justify text-indent: 2em "图1:iTRAQ试剂结合定量蛋白质组学能够揭示病毒不同状态下的蛋白丰度差异(来源Zhihong Hu,JVI, 2012)/span/pp style="text-align: justify text-indent: 2em line-height: 1.75em "EV71(肠道病毒71型)是导致幼儿手足口病的主要病原体之一,其表达两种EV71病毒,包涵体衍生型病毒(occlusion-derived virus,ODV)和出芽型病毒(budded virus,BV)。ODV主要侵染肠,而BV则有可能侵染其他易感组织。如果能够对这两种病毒蛋白层面的差异进行分析,那么就能够掌握病毒颗粒侵染偏向的线索。/pp style="text-align: justify text-indent: 2em line-height: 1.75em "基于iTRAQ试剂的定量蛋白质组学能够很好的完成相似样品在蛋白层面的差异比较。/pp style="text-align: justify text-indent: 2em line-height: 1.75em "在本研究中,研究人员使用不同的iTRAQ试剂(116和117)来标记不同两种不同的肽段样品,等量混合后,使用SCIEX高分辨质谱仪进行数据采集。数据分析软件通过采集到的二级谱图,不仅可以进行肽段序列的鉴定,还能够通过报告离子116和117的相对强度来对该肽段在两个样品中的相对丰度进行定量。通过SCIEX 高分辨质谱系统对EV71两种不同状态下的病毒颗粒中的51个蛋白质进行定量蛋白质组学分析,揭示了EV71在不同状态下高表达的蛋白质,其中有12个BV特异表达的蛋白,有21个ODV特异表达的蛋白,这其中的差异很有可能就是病毒颗粒侵染偏向的原因,这为我们后续的研究提供了重要的线索。/pp style="text-align: center text-indent: 2em line-height: 1.75em "strongspan style="color: rgb(0, 112, 192) "基于SWATH采集技术的定量蛋白质组学绘制全面的病毒蛋白表达及功能谱图/span/strong/pp style="text-indent: 2em line-height: 1.75em "strongspan style="color: rgb(0, 112, 192) "/span/strong/pp style="text-align: center"img style="max-width:100% max-height:100% " src="https://img1.17img.cn/17img/images/202004/uepic/d6902936-0d92-4585-aa4e-308c18e939cc.jpg" title="2222.jpg" alt="2222.jpg"//pp style="text-indent: 2em line-height: 1.75em text-align: center "span style="text-align: justify text-indent: 2em "图2:使用SWATH采集技术结合定量蛋白质组学方法来得到病毒不同蛋白在侵染过程中不同时间点的表达情况(来源:MCP, Anthony,2015)/span/pp style="text-align: justify text-indent: 2em line-height: 1.75em "为了预防和控制急性病毒感染在全球流行,对病毒的基础研究是战略性的。病毒的基础研究中,病毒蛋白的功能,及其在宿主细胞中的动力学是重要的环节,能够让我们更加透彻的了解病毒。SWATH(sequential windowed acquisition of all theoretical fragment ions)采集技术结合定量蛋白质组学策略作为一种数据非依赖采集策略,基于超快速扫描的高分辨质谱TripleTOF系统,能够全面的采集到样品中所有肽段的信息,为我们完整的展现病毒所有蛋白的变化水平。在这个研究中,科研人员使用牛痘病毒为模式病毒,基于TripleTOF系统的SWATH采集模式,为我们展示了病毒蛋白在体内动力学变化的研究流程。/pp style="text-align: justify text-indent: 2em line-height: 1.75em "研究者将不同侵染阶段的样品分别进行蛋白提取及酶解,无需额外的同位素标记及其他后续工作,直接使用SCIEX特有的SWATH采集模式对不同的样品进行采集。之后借助数据分析软件,导入数据库后,就可以直接得到病毒各种蛋白在不同侵染阶段的表达曲线。基于这些信息,我们能够很清楚的了解病毒的不同蛋白各自在何时被表达及执行功能,能够帮助我们绘制出病毒不同蛋白的表达及功能谱图,是病毒基础研究重要的一环。/pp style="text-align: center text-indent: 2em line-height: 1.75em "span style="color: rgb(0, 112, 192) "strong基于差异比较蛋白质组学进行SARS冠状病毒炎症机制研究/strong/span/pp style="text-indent: 2em line-height: 1.75em "span style="color: rgb(0, 112, 192) "strong/strong/span/pp style="text-align: center"img style="max-width:100% max-height:100% " src="https://img1.17img.cn/17img/images/202004/uepic/8fe2a6d0-6c5e-40b7-87b2-4a5543e1715e.jpg" title="3333.jpg" alt="3333.jpg"//pp style="text-indent: 2em line-height: 1.75em "span style="color: rgb(0, 112, 192) "strong/strong/spanbr//pp style="text-align: center text-indent: 2em line-height: 1.75em "图3:定量蛋白质组学策略揭示SARS病毒的PLpro蛋白对宿主细胞免疫相关信号通路的影响(来源:Proteomcis,Cheng-Wen Lin,2012)/pp style="text-align: justify text-indent: 2em line-height: 1.75em "SARS(重症急性呼吸综合征)冠状病毒的PLpro蛋白具有去泛素化酶活性,能够让干扰素调节因子3(Interferon regulatory Factor 3)和NF-kB失活,抑制I型干扰素信号通路,从而降低干扰素(IFN)的表达。在这个研究中,作者使用SCIEX高分辨质谱系统对PLpro过表达的人源幼单核细胞系的蛋白质组学和细胞因子水平进行了分析。发现PLpro过表达后,细胞内炎症因子TGF-b1相关的蛋白呈现显著的上调趋势,与此相关的信号通路为p38 MAPK及 ERK1/2信号通路。这份研究能够为我们在临床抑制SARS冠状病毒介导的炎症提供机制依据。/ppbr//p
  • 大连化物所:基于nMS表征影响蛋白质结构的分子机制
    近日,连化物所生物分子结构表征新方法研究组(1822组)王方军研究员、刘哲益副研究员团队与西南交通大学封顺教授团队合作,利用我所自主搭建的高能紫外激光解离—串联质谱仪器,揭示了质子化氨基酸侧链的正电荷在电喷雾离子化过程中影响蛋白质结构的分子机制,为质谱精确表征蛋白质高级结构提供了参考。非变性质谱(nMS)是研究蛋白质及其复合物组成和高级结构的前沿质谱技术。在nMS分析中采用生物兼容溶液和非变性电喷雾离子化将蛋白质从液相转移至气相并保持高级结构和相互作用。然而带正电荷的质子化氨基酸侧链在失去水分子的溶剂化稳定作用后,会与空间接近的蛋白骨架羰基形成氢键,通过分子内溶剂化稳定侧链正电荷。虽然有报道通过离子迁移—质谱检测到了分子内溶剂化引起的蛋白质碰撞截面积变化,但是对其发生的具体位点和引起结构变化的区域仍然缺乏有效分析手段进行精确表征。在本工作中,研究团队利用我所自主搭建的高能紫外激光解离—串联质谱仪器和蛋白质光解离质谱数据处理软件系统,通过蛋白质紫外光解离碎片离子的价态分布和位点解离碎片产率分析,探测到肌红蛋白带电残基侧链分子内溶剂化的具体位点,以及对蛋白质结构影响的区域位置。团队系统表征了不同价态(质子化数目)下的蛋白质结构差异,发现高电荷价态下蛋白质气相结构易受分子内溶剂化效应的影响而偏离溶液态结构,低电荷蛋白质离子的气相结构更加接近溶液状态。研究团队进一步证明,冠醚18C6与蛋白质带电侧链的络合主要发生在溶液中,随后在电喷雾离子化过程中起到稳定蛋白质结构的作用。紫外激光解离质谱分析揭示冠醚主要结合在蛋白质离子的高电荷密度区域,通过阻断带电侧链的分子内溶剂化使蛋白质气相结构更加接近溶液状态。相关研究结果展示了高能紫外激光解离质谱在同时获取蛋白质序列和动态结构信息中的显著优势,为nMS表征中蛋白质溶液结构的保持和高效表征提供了重要的理论和技术参考。近年来,我所王方军和肖春雷研究员通过交叉学科联合创新攻关,在大连相干光源搭建了高能紫外激光解离—串联质谱实验线站,兼容50-150nm极紫外自由电子激光和193nm准分子激光解离模式,已在多肽(Anal. Chim. Acta,2021)、蛋白质(Cell Chem. Biol.,2022)、金属团簇(J. Phys. Chem. Lett.,2020;Sci. China Chem,2022)等大分子体系的解离和结构表征中取得了系列研究成果。相关研究成果以“Ultraviolet Photodissociation Reveals the Molecular Mechanism of Crown Ether Microsolvation Effect on the Gas-Phase Native-like Protein Structure”为题,于近日发表在《美国化学会志》(Journal of the American Chemical Society)上。该工作的共同第一作者是我所1822组联合培养硕士研究生周伶强和刘哲益。
  • 张玉奎院士、张丽华研究员团队蛋白质组学最新成果:N-磷酸化蛋白质组的深度覆盖分析新方法
    仪器信息网讯 近日,中国科学院大连物理研究所生物分子高效分离与表征研究组(1810组)张丽华研究员和张玉奎院士团队,蛋白组组学分析最新成果发表于《自然-通讯》(Nature Communications)上。团队发展了N-磷酸化肽段高选择性富集新方法,并结合肽段的高效分离和高灵敏度鉴定,实现了N-磷酸化蛋白质组的深度覆盖分析。  与研究相对深入的发生在丝氨酸、苏氨酸和酪氨酸侧链氨基上的蛋白质O-磷酸化修饰相比,发生在蛋白质组氨酸、精氨酸和赖氨酸上的N-磷酸化修饰,由于P-N酰胺键具有较高的吉布斯自由能,且易发生水解,目前仍缺乏有效的N-磷酸化蛋白质组分析方法,制约了人们对其生物学功能的认识。  团队研制了具有核壳结构的亚二微米硅球,并通过在硅球表面键合双二甲基吡啶胺双锌分子,在中性条件下实现了N-磷酸化肽段的高效、高选择性、快速富集 通过基于该材料的on-tip富集方法和液质联用分离鉴定的结合,不仅从HeLa细胞中鉴定到3384个N-磷酸化位点(目前最大的哺乳动物N-磷酸化数据集),而且还发现N-磷酸化位点附近亮氨酸高度表达 建立的N-磷酸化蛋白质组分析新方法不仅为深入研究其生物学功能提供了基础数据,而且也为推动精准医学、合成生物学等领域的发展提供了技术支撑。  上述工作得到国家自然科学基金、国家重点研发计划、中科院大连化物所创新基金等项目的资助。文章链接:《自然-通讯》(Nature Communications)。
  • 地球生命起源蛋白质结构或揭示
    美国罗格斯大学领导的团队在探究生物学中最深刻的未解问题之一时,发现了可能导致古代地球原始汤中生命起源的蛋白质结构。该研究近日发表在《科学进展》杂志上。  研究人员探索了原始生命如何起源于我们星球上的简单非生命材料,他们得出结论,任何有生命的东西都需要从太阳或热液喷口等来源收集和使用能量。  用分子术语来说,这意味着转移电子的能力对生命至关重要。由于电子转移的最佳元素是金属,并且大多数生物活动都是由蛋白质进行的,因此研究人员决定探索两者的结合,即结合金属的蛋白质。  他们比较了所有现有的与金属结合的蛋白质结构,以建立任何共同特征,前提是这些共同特征存在于祖先蛋白质中,并且经过多样化和传承,创造了我们今天看到的众多蛋白质。  蛋白质结构的进化需要了解新折叠是如何从先前存在的折叠中产生的,因此研究人员设计了一种计算方法,发现目前存在的绝大多数金属结合蛋白都有些相似,无论它们结合的金属类型如何。  研究主要作者、罗格斯大学新不伦瑞克分校生物化学和微生物学系教授雅娜布罗姆伯格表示,现有蛋白质的金属结合核心确实都相似,尽管蛋白质本身可能不相似。这些金属结合核心通常由重复的子结构组成,有点像乐高积木。奇怪的是,这些子结构也存在于蛋白质的其他区域,而不仅仅是金属结合核心。观察表明,这些子结构的重排可能有一个或少数共同祖先,并产生了目前可用的全部蛋白质及其功能,亦即人类所知道的生命。  布罗姆伯格说,“我们对生命如何在这个星球上产生信息知之甚少,而我们的工作提供了以前无法获得的解释。这种解释或有助于我们在其他行星和行星体上寻找生命。我们对特定结构构件的发现也可能影响未来合成生物学工作——科学家的目标正是重构出具有特异性的活性蛋白质”。
  • 蛋白质测序技术发展漫谈(续)——基于荧光、纳米孔的单分子蛋白质测序
    前文回顾(点击查看):蛋白质测序技术发展漫谈(上篇);蛋白质测序技术发展漫谈(中篇);蛋白质测序技术发展漫谈(下篇)前面描述了目前成熟的蛋白质测序方法,并对最流行的基于质谱的蛋白质测序方法进行了综述。非质谱依赖的蛋白质测序手段,除了几十年前发展的基于Edman降解法通过气相或液相色谱测序的方法,最近热门领域的方法主要包括基于荧光或纳米孔的单分子蛋白质测序,代表了未来的发展方向。基于纳米孔单分子蛋白质测序方法纳米孔测序(nanopore sequencing)法是借助电泳驱动力使待测单个分子逐一通过纳米孔,通过检测纳米孔截面的电流变化来实现对序列的测定。纳米孔测序最初在1996年被提出,通过膜通道检测多核苷酸序列,也就是单分子DNA的测序[1]。随着使用纳米孔对单分子DNA测序技术的逐渐成熟[2-5],纳米孔技术也被应用在单分子蛋白质的鉴定上。对于DNA来说,其二级结构和电荷相对比较一致,它的聚合物比较容易处理,而且仅由四种碱基组成,单分子DNA测序比较简单。相比之下,蛋白质分子由20种氨基酸组成,并且蛋白的电荷和疏水性多变,还存在大量的二级和三级结构,因此基于纳米孔技术对蛋白质的鉴定要比DNA困难很多[6]。当前的基于纳米孔对蛋白质分析的主要探索方向是通过寡核苷酸适配子或抗体等亲和分子对纳米孔进行功能化,当蛋白质或肽段分子通过纳米孔时,由于不同氨基酸在纳米孔附近的结合或通过会引起不同幅度的电流变化,基于这些变化就可以确定氨基酸的种类,从而逐个得到所测蛋白质或肽段的序列信息(图1)。图 1 借助纳米孔的横向电流检测单分子蛋白质[2]牛津大学的Hagan Bayley[7]团队将单个α-血溶素蛋白孔插入两侧带有电极的膜中,磷酸化的蛋白质在DNA寡核苷酸的牵引下展开,并穿过纳米孔,通过记录纳米孔的电流变化区分出了202个磷酸化蛋白质的4种不同亚型,但无法鉴定蛋白质的一级结构。Francesco[8]团队将蛋白质或氨基酸吸附在金纳米星上,并施加电等离子体力将粒子推进并约束在金纳米孔内,利用金纳米星与金纳米孔壁之间的单个热点,实现了单分子表面增强拉曼散射(SERS)探测,用于检测氨基酸,并且可以分辨仅含有两个不同氨基酸的单个多肽分子抗利尿激素和催产素。Cao等[9]通过单个定点突变,在具有锥形识别位点的耻垢分枝杆菌孔蛋白A(MspA)的纳米孔内腔中引入了甲硫氨酸,从而将该反应有目的的移植到了MspA纳米孔最尖锐的识别位点,并观测到了相应的单分子反应信号。该纳米孔可以引入更多的离子电流,从而放大检测信号,其狭窄的识别位点则提供了更高的空间分辨率,大大削弱了周围氨基酸的干扰,从而拓宽生物纳米孔的单分子检测功能,有望推进基于孔道的单分子蛋白质测序研究。Ouldali[10]研究团队研发出了一种新型气溶素纳米孔,此纳米孔借助将氨基酸附着在聚阳离子载体上,使氨基酸在纳米孔上停留时间变长,并检测其通过纳米孔时电流的变化,最终可识别出组成蛋白质的15种氨基酸,也能检测到组成蛋白质的其余5种氨基酸的电流变化,但是无法对其进行区分。虽然只是对氨基酸进行识别,但作者设想通过对蛋白或者肽段末端氨基酸逐个降解,利用纳米孔技术鉴定从末端释放出来的氨基酸,从而对蛋白质或肽段序列进行测定。Zhao[11]等将一对金属电极分隔在约2nm的孔洞旁,当氨基酸线性穿过这种纳米孔的时候,每一个氨基酸都会完成一个回路,并反馈出相应的电信号,常见的20种氨基酸在通过纳米孔时都可以产生电信号。有的氨基酸需通过大约50种不同信号特征被鉴定,但绝大多数的氨基酸仅需要不到10个信号特征被鉴别。这种方法不仅能够高可信度的鉴定氨基酸,还能区分翻译后修饰的氨基酸(肌氨酸)及其前体(甘氨酸)、区分同分异构体的亮氨酸与异亮氨酸、区分对应对映异构体的氨基酸镜像分子L-天冬酰胺和D-天冬酰胺。此技术被应用于对两条由四个氨基酸组成的短肽(GGGG 和GGLL)进行测序,单分子短肽穿过纳米孔,孔道两边电极记录每个氨基酸通过时产生的电信号,通过测序算法,识别代表不同氨基酸的特征信号,从而得到短肽的序列。基于纳米孔单分子蛋白测序目前还属于初步发展阶段,除了需要根据电信号准确区分组成蛋白质的氨基酸以外,另一个关键是设计可一次拉动一个蛋白质或氨基酸穿过纳米孔的“马达”。为了让蛋白质或肽段顺利穿过纳米孔,研究者们在蛋白质一端添加了一串带有负电的氨基酸或者一段短DNA,用氨基酸或DNA链拉动蛋白质,可以使一些蛋白质打开折叠并顺利穿过纳米孔,但另一些复杂折叠的蛋白需要更多拉力,于是研究者在引导序列上添加了可以打开折叠的ClpX的识别位点[12]。这个系统能够将简单折叠的目标蛋白牵引过纳米孔,但对于折叠非常紧密的蛋白质仍要使用变性剂来打开折叠。基于纳米孔技术对单分子肽段或蛋白质测序目前还停留在对氨基酸鉴定和对短肽的区分阶段,还不能实际应用于对蛋白质的测序。虽然纳米孔测序具有高通量、对样品需求量少的优点,但是现有的纳米孔过大,失去了对氨基酸的区分能力,同时蛋白质分子通过孔道过快,加大了对信号读取难度;其次由于需要将蛋白的三级和二级结构破坏掉,纳米孔道需要能够耐受非常苛刻的化学和力学条件;第三,由于蛋白带电不均匀,控制其穿孔的速率也非常困难。所以目前的方法还不能准确的测得蛋白质的序列,基于纳米孔的单分子蛋白质测序技术还有很大的发展空间。基于荧光的单分子蛋白质测序方法基于荧光的单分子蛋白质测序同纳米孔测序一样,都可以对极少量蛋白质样品进行检测,其原理是先将蛋白质酶解成肽段,对肽段中特定氨基酸选择性标记不同的荧光基团[13],对不同氨基酸上的荧光进行观察,从而确定肽段部分氨基酸序列,再将这些序列与蛋白质组序列比对,即可确定肽段的来源蛋白(图2)。图 2 基于荧光的单分子蛋白测序流程[14]。Ginkel[15] 和Yao [16]都利用ClpXP蛋白酶辅助对肽段进行选择性荧光标记,可对序列中的赖氨酸和半胱氨酸进行标记,通过Förster共振能量转移依次读出被标记的肽段的氨基酸的信号。Swaminathan[14] 将蛋白质酶解成肽段,再将肽段固载到玻璃片上[17],使用特定荧光基团分别对肽段中的赖氨酸和半胱氨酸选择性标记,通过Edman降解技术对固载的肽段进行降解,每次降解后都使用全内反射荧光(TIPF)显微镜进行观测。如果被标记的赖氨酸和半胱氨酸在Edman降解中从肽段N端释放出来,被标记的以上两种氨基酸的位置就会被检测到。同时还发展了用于监测单个肽荧光强度的图像处理算法,并对误差源进行分类和建模,可以测得序列中部分氨基酸的信息。将测得的部分序列与参考蛋白质组序列比对,即可确定肽段的来源蛋白,通过与蛋白质组序列比对,可以鉴定到在人源蛋白质组中的绝大多数蛋白质。基于荧光单分子蛋白测序技术主要有三方面难点,一方面在于目前仅能对赖氨酸和半胱氨酸等几种氨基酸进行特异性荧光基团的标记,无法对所有氨基酸都进行标记;第二个难点是Edman降解是在强酸或强碱的环境中进行,对这些荧光基团的稳定性要求很高;第三个难点是对后期图像处理有较高的要求,如果序列中每个氨基酸都标记上不同的荧光基团,且发光峰易交叠难分辨,这给荧光处理算法带来了难度。因此,基于荧光的单分子蛋白测序技术虽然可以对极微量蛋白质样品分析,但目前仅能测得部分氨基酸序列,对蛋白质全序列的测定目前尚不能实现。[1] Kasianowicz J J, Brandin E, Branton D, et al. Characterization of individual polynucleotide molecules using a membrane channel [J]. Proceedings of the National Academy of Sciences, 1996, 93(24): 13770-13773.[2] Branton D, Deamer D W, Marziali A, et al. The potential and challenges of nanopore sequencing [J]. Nanoscience and technology: A collection of reviews from Nature Journals, 2010: 261-268.[3] Laver T, Harrison J, O’neill P, et al. Assessing the performance of the oxford nanopore technologies minion [J]. Biomolecular detection and quantification, 2015, 3: 1-8.[4] Karlsson E, Lärkeryd A, Sjödin A, et al. Scaffolding of a bacterial genome using MinION nanopore sequencing [J]. Sci Rep, 2015, 5(1): 1-8.[5] Huang S, Romero-Ruiz M, Castell O K, et al. High-throughput optical sensing of nucleic acids in a nanopore array [J]. Nature nanotechnology, 2015, 10(11): 986-991.[6] Nivala J, Marks D B, Akeson M. Unfoldase-mediated protein translocation through an α-hemolysin nanopore [J]. Nat Biotechnol, 2013, 31(3): 247-250.[7] Rosen C B, Rodriguez-Larrea D, Bayley H. Single-molecule site-specific detection of protein phosphorylation with a nanopore [J]. Nat Biotechnol, 2014, 32(2): 179.[8] Huang J, Mousavi M, Giovannini G, et al. Multiplexed Discrimination of Single Amino Acid Residues in Polypeptides in a Single SERS Hot Spot [J]. Angewandte Chemie 2020, 59(28): 11423-11431.[9] Cao J, Jia W, Zhang J, et al. Giant single molecule chemistry events observed from a tetrachloroaurate (III) embedded Mycobacterium smegmatis porin A nanopore [J]. Nature communications, 2019, 10(1): 1-11.[10] Ouldali H, Sarthak K, Ensslen T, et al. Electrical recognition of the twenty proteinogenic amino acids using an aerolysin nanopore [J]. Nat Biotechnol, 2020, 38(2): 176-181.[11] Zhao Y, Ashcroft B, Zhang P, et al. Single-molecule spectroscopy of amino acids and peptides by recognition tunnelling [J]. Nature nanotechnology, 2014, 9(6): 466-473.[12] Nivala J, Mulroney L, Luan Q, et al. Unfolding and Translocation of Proteins Through an Alpha-Hemolysin Nanopore by ClpXP [M]. Nanopore Technology. Springer. 2021: 145-155.[13] Hernandez E T, Swaminathan J, Marcotte E M, et al. Solution-phase and solid-phase sequential, selective modification of side chains in KDYWEC and KDYWE as models for usage in single-molecule protein sequencing [J]. New J Chem, 2017: 462-469.[14] Swaminathan J, Boulgakov A, Hernandez E, et al. Highly parallel single-molecule identification of proteins in zeptomole-scale mixtures [J]. Nat Biotechnol, 2018, 36(11): 1076-1082.[15] Ginkel J V, Filius M, Szczepaniak M, et al. Single-molecule peptide fingerprinting [J]. Proceedings of the National Academy of Sciences, 2018, 115(13): 3338-3343.[16] Yao Y, Docter M, Ginkel J V, et al. Single-molecule protein sequencing through fingerprinting: computational assessment [J]. Phys Biol, 2015, 12(5): 055033.[17] Howard C, Floyd B, Bardo A, et al. Solid-Phase Peptide Capture and Release for Bulk and Single-Molecule Proteomics [J]. ACS Chem Biol, 2020, 15(6): 1401-1407.作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn )。
  • 安捷伦科技发布有助于加快蛋白质高级结构表征的亚二微米反相UHPLC色谱柱
    安捷伦科技发布有助于加快蛋白质高级结构表征的亚二微米反相UHPLC色谱柱 2011 年6 月28 日,安捷伦科技公司(纽约证交所:A)发布了用于UHPLC 系统的ZORBAX RRHD 300SB-C18 1.8 微米色谱柱。该产品为反相硅胶柱,可实现对完整蛋白质和蛋白质酶解物更高级结构的反相色谱表征。 安捷伦生物色谱柱产品经理Linda Lloyd 介绍说:&ldquo 越来越多的研究者开始转向超高压液相色谱仪(UHPLC)分析,以期获得更快、更可靠的分析结果。有了这些新型超高压快速高分离度色谱柱,研究人员现在可以充分利用最新液相技术的优势,包括1260 生物惰性HPLC以及耐 1200 bar 高压的安捷伦1290 Infinity UHPLC。该色谱柱的问世扩展了安捷伦针对蛋白质一级结构分析的产品线。&rdquo 该新型色谱柱采用ZORBAX StableBond 固定相填充,在pH 低至1 时同样具有高稳定性,可以放心使用三氟乙酸和甲酸洗脱液。该色谱柱在温度高达90 ℃时依然非常稳定,耐久性不会有丝毫损害。 如需了解更多信息,请访问:www.agilent.com/chem/BioRPUHPLC。 关于安捷伦科技 安捷伦科技公司(纽约证交所:A)是全球领先的测量公司,同时也是通信、电子、生命科学和化学分析领域的技术领导者。公司的18500 名员工为100 多个国家的客户提供服务。在2010 财政年度,安捷伦的业务净收入为54 亿美元。要了解更多安捷伦科技的信息,请访问:www.agilent.com.cn。
  • 中山大学李惠琳:非变性质谱技术推动蛋白质结构研究,助力新药研发
    蛋白质是生命的物质基础,通过与不同生物分子间的相互作用在生物体内执行着各项重要工作,其功能与结构直接相关。因此,解析蛋白质及其复合物高阶结构对于深入理解蛋白质功能、生理现象及药物研发具有重要意义。过去的60余年,随着X-射线晶体衍射(X-ray)、核磁共振(NMR)以及冷冻电镜(cryoEM)等技术的出现和不断发展,蛋白质结构解析取得了长足发展。然而,如何在分析蛋白质时使其保持近似自然生理环境的非变性状态,对其动态、异质性、相互作用等属性的研究是结构生物学领域的热点和难点。  质谱技术的不断发展使其在蛋白质结构表征领域发挥了越来越重要的作用。非变性质谱(native MS)兴起于20世纪90年代,是一种可以分析蛋白高阶结构的生物质谱方法。与传统的破坏蛋白质立体结构和弱相互作用力的方法不同,非变性质谱采用质谱兼容的近生理pH值的溶液体系(主要为醋酸铵)和更温和的电离方式,使生物大分子在气相中能够最大程度地保持自然折叠状态、非共价相互作用和相关的生物学功能。因此,非变性质谱可以提供分子质量、寡聚态、构象(折叠vs 去折叠)、异质性、配体结合、靶蛋白-小分子亲和力以及复合物中蛋白亚基的相互作用网络关系等更具生物学意义的重要信息,为蛋白质“序列-结构-功能”关系提供分子基础,已成为结构生物学不可或缺的互补工具,在生物制药、蛋白一配体、蛋白一蛋白复合物结构分析等诸多领域具有广泛应用。  近年来,蛋白质结构研究领域经历着剧烈的技术迭代。2021年人工智能(AI) AlphaFol2横空出世,将蛋白质3D结构预测的精度从60%提升到90%以上,在给传统结构解析技术带来冲击的同时,也为结构质谱的发展提供了契机。  未来,非变性质谱技术的发展需要简化样品处理,提升仪器的灵敏度、分析通量和鲁棒性,实现内源性蛋白复合物样本的直接或原位分析,推动其在生物医药表征、蛋白多聚态等领域的更广泛应用。非变性质谱技术与离子消度(MS)、自上而下串联解离(top-down)、电荷检测质谱(CDMsS)等创新联用技术和方法的不断开发及完善,将极大地提升结构信息的广度、丰富度及精确度,补充生物物理学方法缺失的结构信息。同时,非变性质谱与cryoEM1、氢完交换质谱(HDX-MS)、交联质谱等技术联用将更加常态化,这些实验数据与AI结构预测算法的进一步整合将有效解决蛋白及蛋白复合物结构预测存在的精度问题,推动结构生物学发展,助力新药研发。  此外,非变性质谱技术的应用发展将更加关注:1)蛋白复合物结构一功能关系的研究,通过与计算机模拟(MD)、HDX-Ms、cryoEM等技术联用,揭示标志物蛋白在人类疾病发展过程中的作用,推动靶向药物设计和精淮医疗 2)通过研究小分子与靶蛋白的相互作用获取二者结合的亲和力信息,加速靶向药物筛选 3)翻译后修饰(PTMS)、突变等因素导致的蛋白高度异质性及其对蛋白或亚基折叠动力学、构象及构象变化、结合计量比等造成的结构和功能影响 4)蛋白与其他生物分子(配体、DNAA/RNA、金属离子等)之间的相互作用。  李惠琳,中山大学药学院教授,博士生导师。主要从事生物大分子质谱新技术的开发及应用,其研究主要侧重于1)开发整合结构质谱技术,并对蛋白质机器结构、功能和动态变化及靶向药物作用分子机制进行深入研究2)开发middle-down/top-down蛋白质组学技术,探索蛋白翻译后修饰在生命过程中的调控机制。承担国家自然科学基金项目3项,荣获美国质谱学会颁发的Postdoctoral Career Development Award (2014) ,入选珠江人才计划(青年拔尖人才,2019),其研究成果发表在Nature Chemistry, Analytical Chemistry, J. Am.Soc.Mass Spectrom.等杂志。  "非变性质谱技术研究与应用"专栏共收录7篇论文,既介绍了非变性质谱技术的样品制备、离子源、质量分析器、联用技术等基础内容,也涵括了样品提取、样品引入、离子化及电荷操控等方式,以及在蛋白结构及构象解析、蛋白・蛋白相互作用等领域的应用,代表了国内非变性质谱技术的发展现状。希望本专栏能成为《质谱学报》广大读者颇有价值的科技文献,同时也希望更多的学者加入到非变性质谱研究领域,推动我国结构质谱技术的创新发展。
  • 科学家开发出精氨酸二甲基化蛋白质组分析新方法
    近日,中国科学院大连化学物理研究所生物分离分析新材料与新技术研究组研究员叶明亮团队和上海有机化学研究所生物与化学交叉研究中心研究员刘聪团队合作,将硼酸化学引入到甲基化蛋白质组分析方法中,并巧妙利用精氨酸残基上不同修饰基团的位阻差异,实现高效的精氨酸二甲基化肽段富集,显著提高了蛋白质甲基化的分析能力;利用此新方法,系统分析了蛋白质分相过程中精氨酸二甲基化的变化,揭示了此类修饰的发生会降低蛋白质的分相能力。  蛋白质精氨酸甲基化是一种调控蛋白质功能的重要翻译后修饰,与较多疾病的发生发展相关。研究表明,精氨酸二甲基化会影响一些神经退行性疾病相关蛋白的液-液相分离,以及相分离所驱动的无膜细胞器的产生。然而,受限于目前精氨酸二甲基化蛋白质组分析技术覆盖率不足,这类研究仅聚焦于少数几个蛋白,尚未系统性探究精氨酸甲基化对蛋白质相分离的影响。  本研究发现,不同甲基化修饰的精氨酸残基在与邻二酮类化合物反应时,由于位阻不同,反应活性差异巨大。合作团队据此设计了一种精氨酸二甲基化肽段的富集方法:先利用环己二酮选择性的封闭无修饰精氨酸残基,随后利用丙酮醛选择性的在二甲基化精氨酸残基上修饰顺式邻二羟基,从而使得硼酸材料可以选择性的富集精氨酸二甲基化肽段。相比传统的免疫亲和富集方法,该方法拥有较强的精氨酸二甲基化肽段富集能力,特别是在鉴定RG/RGG序列上的精氨酸二甲基化位点方面有更高的灵敏度。合作团队将该方法应用于分析蛋白质相分离过程中精氨酸甲基化的变化,发现包括G3BP1,FUS,hnRNPA1、KHDRBS1在内的一些与无膜细胞器或神经退行性疾病相关的蛋白质上的精氨酸二甲基化程度发生了显著变化;系列实验验证发现,精氨酸甲基化会显著降低这些蛋白质的分相能力,且上述蛋白质组分析中鉴定到变化的甲基化位点是调控蛋白质相分离的关键因素。本工作开发了基于化学反应的精氨酸二甲基化蛋白质组分析方法,并利用这一方法揭示了精氨酸二甲基化对蛋白质液-液相分离具有重要的调控作用。  叶明亮团队致力于蛋白质磷酸化、糖基化、甲基化等翻译后修饰分析新方法的研究,发展了基于可逆酶促化学标记的O-GlcNAc糖肽无痕富集方法,克服了标记基团对糖肽质谱检测的干扰,实现了O-GlcNAc糖基化的高灵敏分析(Angew. Chem. Int. Edit.);利用不同糖肽的同一肽段骨架具有相似碎裂规律的特点,发展出基于“模式识别”的肽段序列鉴定新方法,实现了谱图拓展,显著提高了N-链接位点特异性糖型的鉴定灵敏度,并可发现未知的糖链及糖链修饰(Nat. Commun.)。  相关研究成果以Global profiling of arginine dimethylation in regulating protein phase separation by a steric effect-based chemical-enrichment method为题,发表在《美国国家科学院院刊》(PNAS)上。研究工作得到国家重点研发计划、国家自然科学基金、大连化物所创新基金等的支持。
  • 破译蛋白质结构的秘诀:利用富含炔基的羧基选择性交联剂增加交联覆盖率
    大家好,本周为大家分享一篇发表在Anal. Chem.上的文章,Alkynyl -Enrichable Carboxyl-Selective Crosslinkers to Increase the Crosslinking Coverage for Deciphering Protein Structures,该文章的通讯作者是中国科学院大连化学物理研究所的赵群和张丽华研究员。化学交联结合质谱技术 (CXMS) 的交联覆盖范围对于决定其破译蛋白质的结构的能力具有重要意义。目前,交联质谱技术中最常用的交联剂的类型为针对赖氨酸侧链的N-羟基琥珀酰亚胺 (NHS) 酯基交联剂。然而,此种交联剂存在一定的局限性,尤其是对于含有赖氨酸数目较少的蛋白质;其他类型的氨基酸残基,如羧基等,也可以进行交联反应,以补充赖氨酸残基的局限性并提高 CXMS 的交联覆盖率,然而,羧基的低固有化学反应活性损害了羧基选择性交联剂在复杂样品中的应用。鉴于此,本文开发了三种具有不同反应基团(如酰肼、氨基和氨氧基)的富含炔基的羧基选择性交联剂,以此提高针对酸性残基的交联效率并实现复杂样品的深入交联分析。文章要点:(1)本工作系统地评估了三种交联剂的交联效率,给出了氨基功能化交联剂 BAP 的最佳反应性。此外,结合BAP交联剂于高效的交联富集策略对大肠杆菌裂解物进行交联分析。在 ≤1% 的错误发现率 (FDR) 下,共鉴定出 392 种蛋白质中涉及到的 1291 个 D/E-D/E 交联。(2) 研究结果显示,BAP 与赖氨酸靶向交联剂具有明显的结构互补性,这提高了CXMS 进行蛋白质结构解析的能力。本工作是羧基选择性交联剂首次实现全细胞裂解物的全蛋白质组交联分析。总的来说,这项工作不仅扩展了一个针对酸性残基的十分具有前途的 CXMS 工具包,同时还为提高羧基选择性交联剂的性能提供了有价值的指导。图1 三种交联剂BHP、BAP和BOP的化学性质。(A) 三功能交联剂的化学结构:两个反应性基团用红色表示,一个可修饰的手柄用橙色表示。三种交联剂的Cα原子之间的最大距离约束利用软件Chem3D 19.0计算得出。(B) 利用软件pLink 2.0分析三种交联剂与蛋白质进行交联质谱实验的MS/MS谱。(C) 三种交联剂的反应效率直方图。(D) 酰胺化反应的机理。图2 三种交联剂BHP、BAP和BOP在BSA蛋白质、六蛋白混合物和E. coli 70S ribosome结构分析中的性能。(A) 三种交联剂与BSA的反应中鉴定出的交联的维恩图。(B) 交联的Cα−Cα 距离分布的直方图,通过映射到BSA的晶体结构来验证。(C) BSA中交联残基分布的二维 (2D) 热图。颜色插入表示交联的距离分布。(D) 六蛋白混合物的环形二维交联图。黑线表示蛋白质内的交联,红线表示蛋白质间的交联。(E) 将交联映射到TXN2 (UniProtID:Q99757,PDB:1W4V)、CA2 (UniProtID:P00921,PDB:6SKS)和E. coli 70S ribosome (PDB:5KCS)的X射线晶体结构上,由BAP(红线)和BSP(黄线)鉴定。图3 基于BAP的交联平台,用于大肠杆菌裂解液的全蛋白质组分析,包括蛋白质复合物交联、点击化学、链霉亲和素富集、分馏和LC-MS/MS分析。图4 通过BAP对大肠杆菌裂解液的全蛋白质组分析。(A)富集前后鉴定的谱图数目的比较。黑色和红色分别对应于常规肽和交联肽的谱图。(B)将由BAP(红线)和BSP(黄线)鉴定的交联映射到蛋白质的X射线晶体结构上。(C)将交联映射到由BAP专门鉴定的蛋白质的X射线晶体结构上。 (D)使用Xplor-NIH软件包对hns (UniProtID:P0ACFID) 和grcA (UniProt ID:P68066) 的AF2预测结构进行细化。用BAP和BSP鉴定出的交联分别用红色和黄色标记。在本工作中,作者开发并表征了三种新的可富集的羧基选择性交联剂,它们具有不同的反应基团酰肼、氨基和氨基氧基。其中,氨基功能化交联剂 BAP 对于所有不同复杂度的蛋白质样品均表现出最佳的交联反应活性和鉴定覆盖率。此外,BAP扩展到大肠杆菌裂解液的交联分析与高效的交联富集相结合。本工作首次使用羧基选择性交联剂,以实现全细胞裂解液的全蛋白质组范围内的交联分析。因此,以上所有结果表明,本工作开发的 BAP 是一个很有前途的工具包,可以提高蛋白质结构分析的交联覆盖率。此外,本项工作还可以为提高羧基选择性交联剂的性能提供有价值的指导。参考文献:Gao H, Zhao Q, Gong Z, et al. Alkynyl-Enrichable Carboxyl-Selective Crosslinkers to Increase the Crosslinking Coverage for Deciphering Protein Structures [published online ahead of print, 2022 Aug 29]. Anal Chem.2022 10.1021/acs.analchem.2c02205. doi:10.1021/acs.analchem.2c02205
  • 蛋白分析利器-月旭科技助力探索蛋白质人工化学合成的奥秘
    1965年,中国科学家在世界上首次人工合成牛胰岛素,开启了生命化学研究的新时代。过去数十年历尽科研工作者的不断努力,蛋白质的人工化学合成取得了巨大进步。相较于自然界的生物合成,化学合成可创制具有各种精确控制结构及非天然结构的人造蛋白质,对于发展满足我们需求的蛋白质工具和蛋白质产品带来了新机遇。近期科研工作者们在化学合成蛋白领域又取得了新的成果,并应用了月旭科技的相关色谱柱产品,快来随小编一起饱尝科研的饕餮盛宴吧!化学合成大型镜像聚合酶并实现镜像DNA信息存储WELCH据悉,自然状态下的DNA,会经过精巧的进化来存储遗传信息。而手性倒链L-DNA具有相同的信息能力,但耐生物降解,可作为一个健壮的生物正交信息库。在一项新研究中,清华大学生命学院朱听课题组的研究人员们用化学方法合成了一个90kda的高保真镜像Pfu DNA聚合酶,它能够精确组装一个千碱基大小的镜像基因。该实验中首次使用的大型镜像蛋白质全化学合成策略及千碱基长度镜像基因的组装技术,解决了长期制约镜像生物学领域发展的大型镜像生物分子的制备难题。该研究成果以“利用高保真镜像Pfu DNA聚合酶实现生物正交的镜像DNA信息存储”(Bioorthogonal information storage in L-DNA with a high-fidelity mirror-image Pfu DNA polymerase)为题,于2021年7月29日发表在Nature Biotechnology杂志上。研究成果快览研究人员们用聚合酶在L-DNA中编码路易斯巴斯德1860年的一段话,这段话第一次提出了生物学的镜像世界。为突破全化学合成对蛋白质大小的限制,研究团队通过将嵌合的D-DNA/L-DNA关键分子嵌入到D-DNA存储库中,来实现手性隐写。团队将全长为775个氨基酸的Pfu DNA聚合酶分割为长度为467个氨基酸和308个氨基酸的两个片段分别合成,将其混合后共同复性,使其正确折叠为具有完整功能的90 kDa高保真镜像Pfu DNA聚合酶,为目前已报道最大的全化学合成蛋白质;研究者还利用该高保真镜像聚合酶组装出长达1.5 kb的镜像16S核糖体RNA基因,为目前已报道最长的镜像DNA。此外,他们发现保存在自然环境条件下(当地池塘水中)的微量L-DNA条形码,在1年内仍可扩增和测序;而在相同条件下的D-DNA条形码,在1天后就已经无法扩增。背后原因只有一个:它们的手性不同。在研究中,该课题组利用Ultimate XB-C4 (4.6*250mm, 5μm)来监测反应的进行,并检测肽段产品的纯度。同时用制备柱Ultimate XB-C4和C18 (21.2*250mm, 5μm或10*250mm, 5μm)来分离制备粗品肽段和连接产物。全化学合成富含二硫蛋白质WELCH在生物医学研究中,富含二硫的蛋白质是有用的药物或工具分子,但它们的合成由于折叠的困难而变得复杂。有鉴于此,清华大学的刘磊教授、中国科学技术大学的郑基深教授等研究人员,使用可移除的O-连接的β-N-乙酰葡萄糖胺策略,实现了正确折叠的富含二硫键蛋白质的全化学合成,该研究成果以“Total Chemical Synthesis of Correctly Folded Disulfide-Rich Proteins Using a Removable O-Linked β-N-Acetylglucosamine Strategy”为题,发表于2022年1月3日的JACS杂志上。研究成果快览研究人员描述了一种可移除糖基化修饰(RGM)策略,它可以加速具有多个或甚至链间二硫键的正确折叠蛋白质的化学合成。实验过程中,利用Ultimate XB-C4(120Å或300Å,250mm×4.6mm,5μm)监测蛋白的合成反应,并用半制备柱Ultimate XB-C4和C18(300Å,250mm×10mm,5μm)成功制备得到目标蛋白。该策略包括在Ser/Thr位点引入简单的O-连接的β-N-乙酰氨基葡萄糖(O-GlcNAc)基团,通过稳定其折叠中间体,有效地促进了富含二硫的蛋白质的折叠。折叠后,O-GlcNAc基团可以用β-N-乙酰氨基葡萄糖酶(OGA)被有效地去除,从而获得正确折叠的蛋白质。使用这种策略,该研究组完成了正确折叠的铁调素的合成,这是一种含有四组二硫键的铁调节激素。研究人员首次实现了正确折叠的白细胞介素5(IL-5)的全合成,这是一种26kDa的同型二聚体细胞因子,负责嗜酸性粒细胞的生长和分化。“工欲善其事,必先利其器”,月旭科技专门针对多肽、蛋白类等生物样品方法开发,推出Welch生物样品分析方法开发包,助力前沿的科学研究和日常生产分析制备工作。● 适合蛋白、多肽或其他大分子的方法开发。为了能更好地与键合相发生作用,需使用大孔径(300Å或450Å)的填料。● 不同保留能力的不同选择性键合相,满足各种分子大小的蛋白质、多肽的保留和分离。参考文献1. Ting F. Zhu, et al. Bioorthogonal information storage in l-DNA with a high-fidelity mirror-image Pfu DNA polymerase. Nature Biotechnology,2021. Nature Biotechnology | VOL 39 | December 2021 | 1548–1555.2. Lei Liu, et al. Total Chemical Synthesis of Correctly Folded Disulfide-Rich Proteins Using a Removable O-Linked β-N-Acetylglucosamine Strategy. J. Am. Chem. Soc. 2022, 144, 349−357.
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制