视频号
视频号
抖音号
抖音号
哔哩哔哩号
哔哩哔哩号
app
前沿资讯手机看

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

二维码

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

一文读懂基于长读长技术的单细胞全长转录本测序

分享到微信朋友圈

打开微信,点击底部的“发现”,

使用“扫一扫”即可将网页分享到朋友圈。

分享: 2022/09/29 10:09:58
导读: 单细胞全长测序的本质只是对转录本加了 细胞亚群 的标签,方便从数万条转录本快速筛选到特异性表达的少数转录本。

单细胞全长转录本测序的价值

单细胞测序技术为基础科研、临床诊断、药物研发等领域带来了诸多全新发现视角。现阶段主流的单细胞测序,大多是通过单细胞捕获设备获得cDNA文库后进行打断、扩增、建库,并用二代建库测序分析基因的整体定量。然而,基因在不同组织、不同细胞亚群中会使用mRNA的不同转录本,SNV、融合基因等结构变异也具有组织和细胞特异性,此外,科研界研究比较热门的lncRNA,在不同组织细胞亚群中也具有特异性的表达。这些基于全长序列方面的信息,是目前单细胞二代测序无法获取的。主要原因是目前基于二代测序的单细胞数据局限于3'或5'端的150-250bp,较难满足这类需求。而传统的Smart-seq虽然可以实现全长转录本覆盖,但需要经过拼接组装分析转录本结构,且通量较低,成本较高,研究单细胞可变剪切仍然较为困难。

由于二代测序读长较短,三代测序如PacBio、Nanopore等技术以其长读长的优势解决了这一痛点,因此,如果能将二代测序与三代测序相结合,既能获得mRNA的全长序列,并通过Cell Barcode信息定位到细胞亚群,即可解决了这一单细胞研究领域的痛点。但是,在前期测试中发现,二代单细胞测序一般获得约3万个基因的表达矩阵,三代全长测序能获得超过10万个转录本的表达矩阵,两套数据的聚类图谱差异巨大,现有的分析流程并未很好地解决两套数据的一致性匹配问题。因此,如何能从庞大的二代+三代,也即基因+转录本的单细胞数据中,挖掘到有价值的特异性转录本,可以为单细胞临床转化、药物靶点发现带来更加细致的挖掘角度。

及智医学团队出身单细胞科研服务行业,重点围绕单细胞富集与检测平台、单细胞测序技术平台和基于AI算法的单细胞数据分析算法平台,建立了单细胞转录组、空间转录组、单细胞联合Bulk多组学等多种独特的分析流程和方法,尤其擅长各类免疫细胞与基质细胞的分类、功能解析、细胞互作、药物靶点筛选等分析项目。最终通过积累的上百种单细胞分析方法与百万级别单细胞数据库,为单细胞临床转化类项目提供专业研发服务。及智医学团队生信专家通过高效的自动化分析脚本,并历时数月的二代+三代单细胞算法测试,目前已经解决了二代+三代单细胞聚类的诸多分析难点。伯豪生物基于十多年的单细胞组学服务经验,可提供从样品保存、运输、单细胞悬液制备,到单细胞分选、建库和数据分析的解决方案。及智医学与伯豪生物强强联合,正式推出单细胞全长转录本测序服务,即单细胞cDNA水平的转录、遗传变异研究,通过一次捕获,两种建库,同时获得单细胞聚类与转录本信息:

目前,该技术方向为如下科研问题,提供了潜在的解决办法:

发现携带特定突变的细胞,并与非携带突变细胞相比,挖掘基因表达规律

挖掘功能基因,如膜蛋白、分泌蛋白、转录因子等的转录本使用情况,并发现全新功能转录本

发现融合基因所在细胞亚群,研究它们与其他肿瘤细胞的拟时序分化关系

发现亚群特异性全新IncRNA

获得亚群特异性表达的转录本,能够辅助小核酸类药物开发企业,针对该特异性转录本设计siRNA干扰片段,提升小核酸干扰靶点的有效性。

案例解析

2021年11月11日,来自澳大利亚 沃尔特-伊丽莎霍尔医学研究所的Tian等人开发了一种基于Nanopore测序和10x Genomics的全长转录组单细胞测序方法,分析单细胞中的全长异构体、可变剪接和突变检测。研究成果发表在国际知名期刊Genome Biology(IF=13.6),论文题目为“Comprehensive characterization of single-cell full-length isoforms in human and mouse with long-read sequencing”。

文章中,使用10x Genomics技术分选得到单细胞的全长cDNA后,将cDNA一分为二,一份进行打断建库用于二代测序,另一份进行全长扩增建库用于Nanopore三代测序。此时Nanopore的文库上也包含了细胞Barcode,后续可以通过分析流程将三代测序和二代测序结果通过细胞Barcode一一对应。通过这样的方式,即实现了获得全长转录本,分析亚群的特征性转录本使用,并同时拿到了突变所在细胞。

文章数据分析显示其中40%-60%的Nanopore reads可以分配给预期的Barcode,并保留用于后续分析(图C)。在数据处理过程中,非全长且不能唯一分配给转录本的数据被丢弃。最终每个细胞的平均UMI为10,000至60,000个,并且与对应的短读数据情况相符(图D)。Nanopore和Illumina数据的基因水平的UMI计数也高度一致(图E)

文章数据分析显示其中40%-60%的Nanopore reads可以分配给预期的Barcode,并保留用于后续分析(图C)。在数据处理过程中,非全长且不能唯一分配给转录本的数据被丢弃。最终每个细胞的平均UMI为10,000至60,000个,并且与对应的短读数据情况相符(图D)。Nanopore和Illumina数据的基因水平的UMI计数也高度一致(图E)

通过聚类分析发现,CLL(慢性淋巴细胞白血病)细胞相比正常免疫细胞具有更高比例的新型转录本,特别是新型剪接的转录本。同样,相比激活的干细胞,静态肌肉干细胞也有更高比例的新型转录本(图 D)。

分析发现,约80%的基因可以表达多种转录本(图E),但是大多数基因主要表达1到2种转录本类型(图F),约30%的基因含有多于一种的可变剪接事件,意味着2个最高表达的异构体可能涉及多个外显子的复杂剪接变化而产生不同。

文章通过分析CLL数据,检测到CD45的多种亚型(图G),CD45的表达通过CITE-seq进行验证。CITE-seq可以同时检测RNA和细胞表面蛋白,这种方法结合三代测序,可以对细胞表面蛋白进行更深入的分析和探索。

对CLL数据集进行分析,寻找只存在于癌细胞中的,且在不同的CLL转录簇中具有不同等位基因频率的SNVs,通过经典的曼哈顿图最终发现四个变异在不同的CLL聚类呈现显著差异(图C,D)。其中发现的Gly101Val突变,此突变已被证实通过降低BCL2对venetoclax的亲和力而使患者对venetoclax治疗产生耐药性,通过分析发现患者CLL2携带约25%的Gly101Val突变,并发现该突变不仅属于亚克隆,而且与特定的转录簇相关(图E)。

样品选择与实验细节

由于单细胞全长测序需要对mRNA反转录后的cDNA全长进行测序,核心是需要将完整的全长cDNA扩增至2ug的 Nanopore建库起始量,而常规单细胞是将一链cDNA做基础扩增后全部打断用来做建库测序,因此,这一验细节就意味着单细胞全长测序需要额外质控。本文也从如下四个方面给出一些基础建议:

样品选择

悬液质控

文库质控

单细胞测序剩余样品用于新的科研发现

一:样品选择

常规单细胞测序样品来源分为新鲜采集与液氮速冻两种类型,两种类型的样品需要两种处理方式,新鲜采集样品需要在48h内制备悬液并上机,液氮速冻样品需要将细胞膜破碎,丢弃细胞质,分离提取细胞核,用单个核来做单细胞测序。

不过,由于细胞核里面的RNA大多为初始RNA,包含有较多内含子,而从初始RNA加工为成熟mRNA的过程大多发生在细胞质中,因此,抽核类的项目并不太适用于单细胞全长测序。虽然在2022年7月份一篇Nature Biotechnology的文章是对人脑抽核后的单细胞样品进行三代全长测序,不过由于拿不到成熟mRNA,文章是站在了特定基因在不同亚群的外显子保留这样的科研角度统计规律(如下图)。文章角度非常新颖,也是科研界首次用单细胞全长测序发现人脑中,某些基因在不同亚群中,使用不同的外显子组合,生成多种编码蛋白。不过,由于最终拿到的仍旧是细胞核内的RNA,后续还需要大量验证工作,因此抽核后做单细胞全长测序的临床转化价值较小。所以,单细胞全长测序的项目最适宜采集新鲜样品制备细胞悬液,捕获成熟mRNA开展后续验证工作。

经三代单细胞全长测序发现CADM1基因在人脑神经元(兴奋性、抑制性)、星胶、小胶、少突细胞亚群中,会使用不同的外显子组合。原文也有用蛋白质谱技术对这些外显子的多肽产物进行验证的工作

二:悬液质控

在收集到新鲜样品之后,可以使用商品化的新鲜组织保护液将样品在24h-48h内从临床运输至实验室进行悬液解离,并通过显微镜、细胞计数仪检测悬液质量。

由于全长单细胞对RNA质量要求较高,比较建议悬液活率在85%以上,同时用台盼蓝、AO/PI双染鉴定,并用显微镜仔细观察细胞真实活率、红细胞比例(红细胞在光镜下,可以观察到圆饼状的亮圈,中间有黑色小点,有经验的单细胞实验员可以通过肉眼观察判断出来,而不少品牌的细胞计数仪有可能会把红细胞计算为碎片,甚至检测不到)。另外,现阶段二代单细胞测序,单个样品的数据量大多为100G,可以容纳5000-8000左右的细胞捕获量;而三代测序成本较高,站在节省经费的角度,建议一方面准确的对细胞悬液的浓度进行测定(不可单纯依靠细胞计数仪),来控制上机细胞总数(建议上机不超过1万个细胞);同时也要结合不同品牌单细胞捕获设备的真实捕获率(这点最好找成熟单细胞科研服务公司来完成)来进行综合判定(建议捕获不超5000个细胞,如果超过5000需要增加三代测序数据量)。

三:文库质控

单细胞全长转录本测序,只需要一次捕获,拿到一链cDNA之后要立刻进行全长扩增,如下图:

因此,就需要将已扩增好的cDNA全长进行质控:

如上图,cDNA条带主峰在1-1.5kb左右,下一步可以联系三代测序工厂寄送样品,由他们进行建库测序。但是,也要测序工厂及时反馈三代文库的质检图片,要求文库主峰与cDNA条带主峰一致,方可进行正式的Nanopore上机测序实验。

四:单细胞测序剩余样品用于新的科研发现

由于现阶段三代全长测序的准确性不够高,考虑到后续验证工作,比较建议在单细胞上机之后,将剩余的细胞样品进行冻存,从DNA、RNA、蛋白三个层面开展后续验证实验:

01DNA水平:

在我们前期测试中发现,三代原始数据中基因单核苷酸结构变异SNV(RNA层面的SNP、Indel)较多,为了拿到准确的,与DNA层面一致的突变信息,就需要结合DNA层面的检测来共同筛选核心突变。有两种做法:第一:同时将肿瘤患者的外周血和单细胞实验剩下的肿瘤细胞做全外显子测序(两个样品的市场价合计不超5000元),通过 肿瘤组织测出来 的突变 扣掉 自身PBMC 的胚系突变,可以得到体细胞突变,将这些突变 基因位点作为核心突变,利用自动化脚本,提取 三代数据中的原始 reads,这些reads都带有的 Cell barcode信息可以定位到突变所在的细胞与亚群!即可通过拟时序算法分析突变细胞vs非突变细胞的发育分化轨迹。第二:做全基因组重测序(可以根据具体课题决定是否还需收集PBMC),发现拷贝数变异CNV,以及融合基因信息,将这些信息与三代全长进行联合分析。后续分析内容也极为丰富,可以展开多个科研角度的解释。

02RNA水平:

在三代全长拿到特征性转录本之后,还需要做后续验证,如果序列较少,可以通过5' RACE、3'RACE实验拉全长获得准确序列;如果候选转录本序列较多,也可以通过Pacbio直接做 Bulk 测序(可以混样测一份即可,目的是拿到序列),再结合单细胞全长转录本的特异性表达规律,可以快速、低成本获得这些序列的完整信息,下一步即可通过构建动物模型,开展功能验证工作。

03蛋白层面:

现阶段的单细胞测序大多是以基因作为靶点,但是从已经发表的上万篇单细胞数据中,也经常发现基因的表达特异性并不强,这个是现阶段单细胞测序需要升级改进的核心关键点。而在真实组织中,基因在不同亚群中使用不同的转录本编码多种蛋白产物。有了单细胞全长转录本技术,也就意味着可以将靶点发现从基因细化为转录本,挖掘转录本的蛋白编码产物。因此,临床转化最核心的一步:膜蛋白层面,可以依靠全长转录本获得一些全新的发现。现有的蛋白质质谱技术无法做到 针对单个细胞进行广泛的蛋白质检测,但是蛋白质的编码序列都是从RNA层面的转录本翻译过来,转录本序列的检测比蛋白质的检测要容易很多。所以,这个里面就依托一套简单的逻辑:从DNA到RNA到蛋白的中心法则,即可做到通过单细胞全长转录本测序,发现亚群特异性转录本,再将转录本序列预测的多肽产物与蛋白质谱打出来的多肽产物进行匹配,发现一条潜在的转录本+编码产物,即为一条新型潜在靶点。其实,在肿瘤新抗原发现领域,这套序列预测+质谱检测的策略已经非常成熟并且较为实用,因此,可以基于中心法则将这套成熟策略转用到单细胞全长转录本发现新型蛋白编码产物领域。

总结

综上所述,单细胞全长转录本更适合做新鲜样品,整体实验过程并不复杂,基本上现阶段单细胞科技服务类公司都能实现,只需要在几个细节上稍加注意即可。

总结下来,单细胞全长测序的本质只是对转录本加了 细胞亚群 的标签,方便从数万条转录本快速筛选到特异性表达的少数转录本。这个并不是一套全新开发的技术,只能算是从DNA到RNA到蛋白的一整套符合中心法则的单细胞多组学的技术方案。在我们前期拜访前沿课题组的过程中,有不少研究员曾想过这样的方法,只是行业内缺乏前人尝试。我们深入思考过这些细节后,发现这套方案从样品的选择、测序实验、数据呈现,均比现阶段的单细胞二代测序更加实用,更加贴近临床转化。从另外一个角度,转录本是基因功能实现的最小细分单位,针对转录本研究的单细胞全长测序,算得上是转录组研究领域的终点站。

[来源:10x Genomics]

用户头像

作者:兆堃

总阅读量 194w+ 查看ta的文章

网友评论  0
为您推荐 精选资讯 最新资讯 新闻专题 更多推荐

版权与免责声明:

① 凡本网注明"来源:仪器信息网"的所有作品,版权均属于仪器信息网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:仪器信息网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认仪器信息网有权转载。

使用积分打赏TA的文章

到积分加油站,赚取更多积分

谢谢您的赞赏,您的鼓励是我前进的动力~

打赏失败了~

评论成功+4积分

评论成功,积分获取达到限制

收藏成功
取消收藏成功
点赞成功
取消点赞成功

投票成功~

投票失败了~