当前位置: 仪器信息网 > 行业主题 > >

基因组组装

仪器信息网基因组组装专题为您整合基因组组装相关的最新文章,在基因组组装专题,您不仅可以免费浏览基因组组装的资讯, 同时您还可以浏览基因组组装的相关资料、解决方案,参与社区基因组组装话题讨论。

基因组组装相关的资讯

  • 科学家改良基因组组装流程 提高测序成本效益
    据物理学家组织网5月5日报道,最近,美国能源部联合基因组研究所(DOE JGI)、太平洋生物科学公司(PacBio)与华盛顿大学合作,开发出一种改良的基因组组装工艺流程,生成的读取片段达到数万个核苷酸长度,最终的组装序列准确率大于99.999%。以往的桑格技术只有700个核苷酸,新工艺大大提高了测序组装和分析的成本效益。相关论文在线发表于5月5日的《自然· 方法学》上。   人们在降低成本和DNA测序通量上已取得巨大进步,但在重建基因组过程中,仍面临很大挑战。现有技术擅于造出短DNA字母片段(读取片段),经过计算把它们拼一起(组装)成为长链,以此来确定目标序列中这些字母的序列和功能。基因组装就好比把几百万的&ldquo 拼图&rdquo 拼在一起,而事先不知道原图是什么样子。由于DNA片段非常小而数量却极大,用目前流行方法来组装非常困难。   研究小组描述这一工艺为&ldquo 从DNA样品制备到最终基因组确定的全自动过程&rdquo ,所用技术叫做HGAP(分级基因组组装过程)。利用太平洋生物科学公司的单分子实时DNA测序平台,生成的读取片段达到数万个核苷酸长度,比人类基因组计划时期的主力技术&mdash &mdash 桑格测序技术还要长。   桑格技术只能产出约700个核苷酸的读取片段,而且要建多个DNA库控制多种运行,结合数据分析才能填补碱基编码空缺。后桑格法也需要多个库,但结合了优选技术。据研究小组报告,HGAP则相反, &ldquo 只需准备一个DNA库,就会自动连续不断地读取单分子实时测序完成组装,而不需要循环一致测序。&rdquo 他们还用DOE JGI以往测序过的3种细菌对新方法进行了测试,收集数据进行了对比,发现HGAP方法最终组装好的序列准确率大于99.999%。   &ldquo 我们一直在寻找新做法,在产出高质量数据的同时提高效率。&rdquo DOE JGI基因组技术副主管兰恩· 潘那奇奥说,&ldquo 我们在研究多种改良技术以实现规模经济效益,这只是其中之一。&rdquo 在全世界已完成或正在进行的两万多个基因组项目中,超过20%在使用DOE JGI的测序技术,大多集中在环境生物学、能源和碳处理方面。目前,研究小组正在进一步扩展这种新方法的应用范围,以研究更复杂有机生物的基因组。   太平洋生物科学公司首席科学官乔纳斯· 克拉奇也表示,通过与JGI微生物和微生物基因组组装与注释领域的科学家合作,他们才能改变单分子测序组装方法,使组装结果质量更高,而且在速度和价格方面能与下一代测序与组装方法竞争。
  • 如何精准检测评估基因组组装质量?中国科研团队研发出一款新工具
    近年来,随着基因测序技术和算法不断发展,大量物种基因组被陆续测序和组装,为相关研究和应用提供重要遗传信息。因此,如何精准检测评估基因组组装质量高低、避免组装错误等非常关键,也备受关注。  记者19日从中国科学院植物研究所获悉,该所焦远年研究团队最新研究开发出一种不依赖参考基因组的组装质量评估新工具CRAQ(Clipping information for Revealing Assembly Quality),可以在单碱基水平检测和评估基因组序列的精准度,并提供相关纠错方案。这一基因组研究领域的重要成果论文,近日在国际学术期刊《自然-通讯》上线发表。CRAQ工具的整体流程示意图。中国科学院植物所 供图  论文通讯作者焦远年研究员指出,高质量的参考基因组序列对于基因注释和相关功能研究至关重要,也是大规模比较基因组学和表观遗传调控研究的重要前提。不过,目前多数基因组序列中仍然存在一些组装错误,给相关研究带来一定程度影响。而精准区分和鉴定高质量与低质量的基因组序列,不仅可以为基因组组装质量提供评估依据和进一步改进提供靶点,也可以为后期比较基因组和功能研究位点提供基因组序列质量认证。当前,虽然已有一些基因组组装质量评估的方法和指标,但其大多仅提供一个总体的评估值,没有针对特定区域或碱基的评估信息。  针对这一问题,该研究团队研发的CRAQ通过将原始测序序列比对到组装的基因组上,基于序列比对产生的有效“剪切对齐”信息,可精准地检测基因组中存在的组装错误。结合长读长测序片段和短读长测序片段与基因组比对的特征,CRAQ可以识别基因组内小规模的区域组装错误和大范围的结构组装错误,不同类别的错误数量经过统计和标准化处理后被转化为两个组装质量评估指标,以反映不同层面的基因组组装质量。CRAQ检测并纠正组装嵌合片段示例。中国科学院植物所 供图  同时,CRAQ能够将组装错误与基因组内的高杂合区域或单倍型差异区分开来,并在单碱基分辨率下指示低质量组装区域和潜在错误断点的位置。在此基础上,CRAQ能帮助研究人员识别基因组中存在的嵌合片段,并将这些片段准确地拆分,以利于结合光学图谱或构象捕获技术进一步构建结构更加准确的参考基因组。  据研究团队介绍,为对CRAQ进行性能测试和评估,他们以人类参考基因组组装为基础构建一个模拟数据集并利用CRAQ和目前广泛使用的基因组质量评估工具进行测试和比较,结果表明,当缺乏完美参考基因组时,CRAQ表现最佳,并在检测杂合区域方面也表现出超过95%的召回率和精确度。研究团队还通过对一个真实的果蝇杂交的基因组数据集进行分析,发现CRAQ可以准确地将组装错误和杂合区域区分开来,而其他工具则无法检测出杂合区域。
  • 中科院海洋所首次完成仿刺参基因组测序和组装
    日前,我国科学家在国际上首次完成仿刺参基因组测序和组装,对刺参生物学和遗传育种研究具有重要科学意义,将对我国刺参产业发展产生重要推动作用。该成果由中国科学院海洋研究所研究员杨红生团队和相建海团队共同完成,在天津生物芯片技术公司的技术支撑下,突破了刺参复杂基因组测序和组装技术瓶颈,采用新一代测序技术获得132Gb高质量DNA序列数据,覆盖全基因组160倍。科研人员利用针对高复杂度基因组组装的创新策略,在国际上首次成功完成了野生刺参的基因组组装,目前获得的框架图总长度达到765Mb,组装叠连群Contig N50达112Kb,该数值优于国际迄今已发表的多数水产动物基因组图谱的指标。初步检测表明,功能基因区覆盖达95%以上。该项研究得到了国家科技部“973”、“863”计划,国家基金委,中国科学院和山东省、青岛市科技厅的资助。早在上世纪50年代,海洋所科研人员就开展了海参的形态分类和经典生物学研究,查清了我国海参的分布和生物多样性特征,阐明了其分类学地位。仿刺参(又称刺参),属于棘皮动物门,主要分布于中国的黄渤海和俄罗斯、南北朝鲜和日本等东北亚海域。由于刺参特殊的进化地位、独特的繁殖生活史以及夏眠、排脏与再生、自溶等生物学现象,使其具有重要的科学研究价值。同时,刺参也是我国现有20种可食用的海参中品质最好、经济价值最高的种类,2013年我国刺参养殖面积达21.5万公顷,总产量达19.4万吨,产值近300亿元,约占全国当年海水养殖产值的15%。十多年来,杨红生等针对刺参的基础生物学、生态学和遗传育种应用开展了契而不舍的系统研究,取得了十分丰厚的科技成果,在理解刺参夏眠、再生和行为学上获得若干新认知,构建了刺参的遗传育种群体,培育了具有耐温高产、多刺和不同体色等性状的刺参新品系,并进行了示范应用和推广。近两年,针对我国刺参养殖业面临育苗变态困难、成活率低下、养殖病害严重、种质退化、品质欠佳等一系列问题,杨红生研究员团队与相建海研究员团队合作,共同开展刺参基因组学研究,通过刺参基因信息的全面破译,在特殊生命现象的剖析、重要经济性状的分子解析、基因资源挖掘与利用、物种进化等多个领域的开展深入研究。全基因组序列的成功破译作为对刺参认知创新的里程碑,将为刺参的繁殖发育、免疫调控、营养代谢、遗传解析提供重要理论支撑,有力推动刺参重要经济性状解析、分子标记辅助选育和全基因组遗传育种,以及揭示刺参的夏眠、再生、自溶等特殊生命现象的机理机制等相关研究,为我国刺参产业健康可持续发展提供有力科技支撑。
  • 汤富酬课题组实现基于单细胞测序数据的人类基因组从头组装
    随着三代测序技术(TGS,也即单分子测序技术)的发展,基于大量细胞的三代基因组测序数据被广泛应用于各种复杂大型基因组的组装,由于其读长相比于二代测序(NGS)技术有数百倍的增加,因此基因组中重复序列区域以及染色体重排等复杂结构变异区域都能被更好地组装出来。对于人类基因组的组装研究,端粒到端粒(T2T)联盟在2022年3月,使用纯合二倍体细胞系CHM13率先发布了首个完整的端粒到端粒的人类基因组参考序列CHM13v1.1。2022年3月,人类泛基因组联盟(HPRC)在预印本平台bioRxiv上发布了首个高质量人类杂合二倍体细胞系HG002的单倍型组装结果。目前,高质量的基因组组装通常依赖于大量细胞混合样本的三代测序数据,需要大量的基因组DNA(通常需要从数百万个细胞中提取几十微克基因组DNA),然而在基因组组装的实际应用中常常要面对两个困难:1、细胞群体中存在遗传异质性。基于大量细胞三代测序数据的基因组组装需要确保测序的样本中每个细胞的遗传背景高度一致,否则组装结果将很难区分同一个细胞内的不同单倍型基因组之间的差异和不同细胞亚群之间的基因组差异。只有降低或者消除细胞间的遗传异质性才能确保单倍型组装的准确性。但是,在人体正常组织样本中也常常广泛存在体细胞拷贝数变异(CNA)。与此同时,正常的人类细胞也会不断积累突变,同一块人体组织常常是由很多包含不同突变的细胞克隆组成。在癌症研究中,同一个肿瘤样本中不同癌细胞亚克隆之间的基因组异质性就更为明显。2、细胞数量稀少。在很多情况下,很难获取上百万个细胞以提取大量(几微克)基因组DNA。例如,在早期胚胎发育研究、司法检验、特别是在癌症基因组研究中(如循环肿瘤细胞、肿瘤活检样本、脑脊液中的肿瘤细胞、以及腹水中的肿瘤细胞等),能够获取的细胞数量常常很稀少,而且这些细胞很难在体外培养和扩增;即使偶尔可以培养扩增,也不能保证在体外培养扩增过程中其基因组不会进一步产生新的遗传变异。基于二代测序(NGS)平台的单细胞基因测序技术被广泛应用于微生物等简单小型基因组的组装。许多种类的细菌无法在实验室中培养,单细胞基因组测序可以与宏基因组学方法结合起来完成微生物的基因组组装。由于人类基因组结构、大小、以及复杂程度远超细菌等微生物,单纯使用基于二代测序平台的大量细胞基因组测序数据也无法组装出高质量的人类基因组参考序列(NG50很难达到Mb(百万碱基对)级别),那么使用少量DNA甚至单细胞基因组测序数据组装人类基因组则更具挑战性,它不仅需要基于三代测序平台的单细胞基因组长读长测序技术的支持,还需要合适的组装软件以及良好的生物信息学分析策略。2022年7月12日,北京大学生物医学前沿创新中心(BIOPIC)汤富酬课题组在Nucleic Acids Research发表了题为De novo assembly of human genome at single-cell levels的研究论文。该研究使用优化的SMOOTH-seq单细胞基因组三代测序技术,基于Pacific Biosciences(PacBio)HiFi和Oxford Nanopore Technologies(ONT)两种三代测序平台首次在单细胞水平上完成了Mb级连续性的人类基因组组装,并使用多种评价指标,充分探索了不同测序策略和组装工具对基因组组装结果的影响。1、全面优化了SMOOTH-seq单细胞基因组三代测序技术,使其同时适用于PacBio和ONT两种主流单分子测序平台。此前的SMOOTH-seq技术只适用于PacBio单分子测序平台,使用场景有较大的局限性。优化后的SMOOTH-seq技术既可以用于PacBio单分子测序平台,也可以用于ONT单分子测序平台,使用场景更加灵活,可以兼顾测序数据准确性和测序成本。2、使用hifiasm,Hicanu,wtdbg2等主流组装工具和95个单细胞的三代基因组测序数据(Pacbio HiFi平台),对人类慢性粒细胞性白血病(CML)细胞系K562进行了高质量基因组组装。组装出的主要叠连群(primary contig)的NG50(可覆盖50%的已知基因组区域的最短叠连群的长度)可达2.11Mb,也就是说在这个组装出的参考序列中,人类基因组中一半(15亿碱基对)以上的区域都被至少2.11Mb以上的叠连群覆盖了。最长叠连群可达14.12Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例接近95%,且大部分组织相容性复合体(MHC)位点(基因组上的一个有代表性的复杂区域,全长约6Mb)被成功组装出来(如图1所示)。图1. 95个K562细胞的基因组组装结果(Pacbio HiFi)3、使用hifiasm,Hicanu,wtdbg2等主流组装工具和人类正常二倍体细胞系HG002的157个单细胞的基因组三代测序数据(Pacbio HiFi平台)对人类基因组进行了高质量组装。组装出的主要叠连群(primary contig)的NG50可达0.65Mb,最长的叠连群可达6.82Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例接近91%。在使用此数据进行HG002的单倍型组装的过程中该研究发现经过指数扩增的基因组数据的k-mer分布会发生偏移,因此使用有双亲二代测序数据作为辅助的Trio-binning模式进行基因组单倍型组装结果更为准确。因此该研究分别使用Trio hifiasm和Trio Hicanu两种组织工具进行单倍型组装,得到的亲本叠连群的NG50可达0.3Mb左右,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例均超过84%。通过比较HG002亲本六种经典人类白细胞抗原(HLA)位点的组装分型结果,Trio Hicanu能够正确组装出HLA区域的两个亲本的大部分基因位点(如图2所示)。图2. 157个HG002细胞的基因组组装结果(Pacbio HiFi)4、使用Flye,Necat,wtdbg2等主流组装工具和人类正常二倍体细胞系HG002的192个单细胞的三代基因组测序数据(ONT平台,低测序深度)对人类基因组进行高质量组装。研究发现,不同的组装工具对最终组装结果有很大影响,Flye展现出更为适合单细胞ONT三代测序数据的特性,组装出的叠连群的NG50可达1.38Mb,最长叠连群可达11.42Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例超过93%,多项指标都远超另外两个组装工具。同时组装结果能够补齐39个hg38版本的人类参考基因组中未组装出的缺口(gap)区域,其中14个区域在hg38中注释的长度超过50Kb(如图3所示)。图3. 192个HG002细胞以及30个HG002细胞的基因组组装结果(ONT)5、使用Flye,wtdbg2等组装工具和人类正常二倍体细胞系HG002的30个单细胞的三代基因组测序数据(ONT平台,高测序深度)对人类基因组进行高质量组装。为了探究仅使用极少量单细胞的基因组测序数据进行人类基因组组装的极限情况,该研究分别使用1个、10个、20个和30个单细胞尝试进行人类基因组组装,发现仅需要高测序深度的30个单细胞的基因组测序数据(平均基因组覆盖度~41.7%)就能完成叠连群 NG50高达1.34Mb连续性的组装。同时组装结果能够补齐38个hg38版本的人类参考基因组未组装出的gap区域,其中15个区域在hg38注释的长度超过50Kb(如图4所示)。图4. 30个基因组高覆盖度HG002细胞的基因组组装结果(ONT)6、通过对K562细胞系基因组的从头组装,该研究相比于使用原始单细胞基因组三代测序数据能更精准地鉴定出更多的基因组插入事件和复杂结构变异事件。对于K562这样的白血病细胞系,基因组从头组装之后是否能更好地鉴定出基因组结构变异(SV)事件是癌症研究中的重要问题。该研究分别使用hifiasm和Hicanu组装出的主要(primary)叠连群和替代(alternate) 叠连群来进行结构变异鉴定。发现组装后的叠连群比起原始单细胞数据直接比对能更准确地鉴定出基因组插入事件,召回率达到70%以上,精确度达到90%以上。同时,K562中的三对经典融合基因:CDC25A-GRID1、BCR-ABL1和NUP214-XKR3都能被精准地鉴定出来,而CDC25A-GRID1融合在原始单细胞基因组数据直接比对到参考基因组时是无法被发现的 (如图5所示) 。为了进一步验证基因组从头组装后找到的结构变异事件的准确性,该研究挑选了20个(14个插入事件,6个缺失事件)在组装后的叠连群中被鉴定到、但是在单细胞基因组原始测序数据直接比对到参考基因组时没有被鉴定出来的结构变异事件进行了PCR验证,准确率高达80%,证明了组装后的叠连群对结构变异事件的鉴定是精准可靠的(如图6所示)。图5. 组装后叠连群(contig)中结构变异事件检测的准确性 图6. PCR验证基因组结构变异事件的结果综上,为了解决基因组从头组装在实际应用中遇到的细胞遗传异质性和细胞稀缺性的问题,该研究使用优化的SMOOTH-seq技术在两种不同的主流三代测序平台上,采用不同的测序策略(高通量、低深度测序策略(multi-cells with low sequencing depth)和低通量、高深度测序策略(few-cells with high sequencing depth)),使用多种不同组装软件(hifiasm,Hicanu,wtdbg2, Flye,Necat等)、多个评价指标、以及不同组装策略,探讨了利用单细胞测序数据从头组装人类基因组的可行性,并确定了影响组装结果的主要因素,将基因组组装的分辨率提高到单细胞水平(少至30个单细胞)。未来随着单细胞测序技术和基因组组装策略的进一步发展,最终必将实现只用一个单细胞的测序数据就能组装出Mb级连续性的人类参考基因组的梦想。北京大学生命科学学院博士生谢昊伶以及北京大学前沿交叉学科研究院博士生李文为该论文的并列第一作者。北京大学生物医学前沿创新中心汤富酬教授为该论文的通讯作者。该研究项目得到了北大-清华生命科学联合中心、国家自然科学基金委、北京市科技委和北京未来基因诊断高精尖创新中心的支持。论文链接:https://doi.org/10.1093/nar/gkac586汤富酬研究员简介:汤富酬,博士,北京大学BIOPIC/ICG研究员,国家“优青”(2013)、“杰青”(2016)。1998年本科毕业于北京大学,2003年在北大获得细胞生物学博士学位,2004-2010年间在英国剑桥大学Gurdon研究所从事博士后研究, 2010年回到北京大学组建实验室,主要从事人类早期胚胎发育的单细胞功能基因组学研究。在国际上率先系统发展了单细胞功能基因组学研究体系,并利用一系列技术体系对人类早期胚胎发育进行了深入、系统的研究,揭示了人类早期胚胎DNA去甲基化过程的异质性以及其他表观遗传学关键特征,发现了人类早期胚胎中基因表达网络的重要表观遗传学调控机理,为人们提供了一个全面分析人类早期胚胎表观遗传调控网络的研究框架,加深了对人类原始生殖细胞的发育以及表观遗传重编程过程的认识。
  • Nature子刊!多种测序技术联合 助力高质量豌豆参考基因组和泛基因组发布
    2022年9月22日,中国农业科学院作物科学研究所联合中国科学院微生物所、山东省农业科学院农作物种质资源研究所、国际半干旱热带作物研究所和澳大利亚默多克大学等国内外多家单位在Nature Genetics上以长文的形式发表了题为Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics的研究论文。研究团队完成了中国豌豆主栽品种“中豌6号”的基因组组装和解析,解决了长期以来悬而未决的豌豆基因组精细物理图谱组装难题,揭示了豌豆基因组结构和进化的独特特征,发掘了一批与粒型、株高和荚型等孟德尔性状和重要农艺性状相关的位点和基因,同时构建了栽培和野生豌豆泛基因组,展示了豌豆近缘野生种和地方品种作为未来豌豆育种改良资源的巨大潜力。高质量的参考基因组、注释和泛基因组对豌豆种质资源挖掘利用和育种改良的基础与应用研究具有重要参考价值和指导作用,同时也为其他豆科作物基因组和泛基因组研究提供了重要借鉴。自孟德尔发现遗传定律以来,豌豆作为遗传研究的“明星”植物,受到了学界和公众的广泛关注。豌豆 (Pisum sativum L., 2n=2x=14) 是一年生冷季食用豆类,属于豆科(Leguminosae)、蝶形花亚科(Papilionoideae)、野豌豆族(Viceae)、豌豆属(Pisum L.)。豌豆富含蛋白质、淀粉、纤维素和多种矿物质,是粮菜饲兼用的食用豆类作物,在世界范围内广泛种植。据FAO统计资料显示(http://www.fao.org/faostat/),世界豌豆的总产量和种植面积逐年增加,中国豌豆特别是鲜豌豆的总产量与种植面积也增长迅速。同时,豌豆的生物固氮能力可以减少氮肥使用,有效改善土壤结构,还可作为倒茬作物减少病虫害,促进农业和自然生态系统的可持续发展。作物种质资源是支撑农业发展创新和作物遗传改良的物质基础,目前国家作物种质库保存豌豆种质资源达到7000余份,蕴藏着丰富的遗传多样性,亟待深入挖掘和利用【1】。图1 中豌6号形态特征及豌豆种质资源多样性豌豆基因组大小约为4.28 Gb,远大于大豆(4倍)、鹰嘴豆(6倍)、普通菜豆(7倍)、绿豆和小豆(8倍)等其他豆科作物基因组,其基因组中有超过80%的重复序列。由于豌豆基因组的复杂性,直到2019年,国际上才公布了第一版以二代测序技术(Next Generation Sequencing, NGS)为主的豌豆参考基因组,为豆科植物基因组进化提供了新的见解【2】。然而,由于NGS技术的短板,这一版基因组组装得到的218,010个contigs的 N50 值仅为37.9 Kb,组装结果碎片化严重,尤其是在复杂的重复区域,与高质量参考基因组的标准相去甚远【2】。此外,研究表明,与国外豌豆种质资源相比,中国豌豆具有独特的遗传背景和丰富的遗传变异【3】。由于缺乏豌豆高质量基因组和精细物理图谱,严重滞后了豌豆重要农艺性状的遗传解析和种质资源挖掘利用进展,尤其阻碍了对国内外不同豌豆种质资源的综合利用。为了解决上述科学难题,研究团队利用中国豌豆主栽品种“中豌6号(ZW6)”,以PacBio 单分子实时 (SMRT) 测序为基础,结合 10x 长片段测序、Bionano 光学图谱和染色质三维构象捕获 (Hi-C),以及 Illumina NGS 技术,联合优化多种组装策略,完成了迄今为止最高质量的豌豆基因组精细图谱和基因注释(图2)。该基因组组装大小约为3.8 Gb,序列对总共7条染色体的定位率达到97.96%,组装的contig水平N50达到了8.98Mb。通过遗传图谱一致性评估、BUSCO分析、Merqury分析以及LAI分析在内的综合基因组组装评估方法,均表明该组装在连续性、准确性和完整性方面表现优异。此外,该组装共注释出47,526个编码基因,并且在基因完整性、调控区完整性、转座子组装完整性和注释完整性方面均得到了明显改善。豌豆基因组高质量精细物理图谱的获得,拓宽了我们对豌豆巨大基因组背后遗传学的了解,为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供了宝贵基因组资源。图2. 豌豆基因组的重要特征。豌豆大约在10,000 年前被驯化,被认为是最早驯化的豆类作物之一。然而,尽管它在推进植物遗传学方面发挥了关键作用,但豌豆属内的物种划分长期存在争议,其驯化过程仍不清楚【4】。研究团队基于118个栽培和野生豌豆的全基因组重测序数据,不仅揭示了栽培和野生豌豆SNP、InDel和SV等不同变异类型的基因组多态性特征,同时基于SNP和SV多态性变异信息的群体遗传结构和系统发育分析,阐明了栽培和野生豌豆的群体遗传结构,支持豌豆属内包含3个物种P. fulvum、P. sativum 和 P. abyssinicum的结论。同时在 P. sativum中鉴定出了三个遗传分组,其中 P. sativum II (PSII) 和 P. sativum III (PSIII) 主要对应于代表亚洲和欧洲不同地理区域栽培豌豆的两个遗传分组,可能与豌豆驯化后的传播途径有关(图3)。以上结果解决了长期以来关于豌豆属物种划分的争议,为豌豆起源驯化提供了新的基因组学证据,也为豌豆种质资源的综合开发利用提供了科学依据。图3 基于SNP (a, b, e)和SV (c, d, f)的118份栽培和野生豌豆的群体遗传结构。孟德尔通过研究豌豆的七个性状发现了遗传规律,开创了遗传学研究的先河。在过去的几十年中,孟德尔研究的四个性状包括粒型(R/r)、株高(Le/le)、子叶颜色(I/i)以及种皮和花色(A/ a)的四个基因位点已经被克隆并进行了功能分析;而其他三个孟德尔性状,果荚颜色 (GP/gp)、荚型 (V/v) 和花的位置 (Fa/fa)相关的基因位点尚未解析【5】。为了探索豌豆重要农艺性状的遗传基础,研究团队利用GBS测序对WJ×ZW6杂交构建的300个F2群体中的12个农艺性状进行了QTL分析(图4),鉴定出了25 个与12个农艺性状相关的QTLs,其中有三个为孟德尔性状相关位点和基因,包括控制粒型(圆粒/皱粒,R/r)和株高(高/矮,Le/le)的孟德尔基因,以及与荚型(硬荚/软荚,V/v)相关的候选基因。图4 豌豆12个农艺性状QTL分析结果以及与孟德尔性状相关的3个QTL位点和基因【5】。越来越多的研究表明,单一的参考基因组不足以代表一个物种,特别是对于豌豆这类经历过长期驯化的物种,而泛基因组分析为作物种质资源变异解析和挖掘利用提供了有效手段。为了更深入地了解栽培和野生豌豆的多样性,研究团队构建了基于116个栽培和野生豌豆全基因组测序的泛基因组(图5),发现栽培和野生豌豆种质资源大部分泛基因组多样性主要存在于不同物种和遗传分组之间,并且以特有基因组序列的形式存在。对豌豆泛基因的存在/缺失变异模式(PAV)分析发现,随着新基因组数目的增加,核心基因的数量减少,而泛基因的数量增加,并逐渐趋于饱和(图5a)。同时,在多个豌豆基因型中存在的核心基因在其他27 个植物基因组中也更保守(图5b),表明它们具备通用的核心功能。基于跨基因组同源基因系统发育分类方法(HOG),研究人员将116个泛基因组的基因聚类生成 112,776个泛基因簇,在不同物种之间显示出差异显著的PAV模式(图5c)。对不同泛基因分组中特有泛基因的 GO 分析显示出保守基因和可变基因之间的不同功能富集。值得注意的是,P. abyssinicum独特的泛基因在刺激和化学反应方面富集,而P. fulvum的泛基因在发育、生长、繁殖、细胞骨架等方面富集,进一步证实了豌豆野生近缘种和地方种质资源作为育种材料在未来提高豌豆品种抗性和产量方面的潜在价值。图5 116个代表性栽培和野生豌豆的泛基因组分析结果(包括 ZW6)。总之,研究人员克服了复杂基因组组装的多重障碍,成功绘制了中国豌豆基因组高质量精细物理图谱,还构建了栽培和野生豌豆泛基因组,揭示了豌豆基因组进化特征、群体遗传结构与重要性状的分子基础,为豌豆起源驯化、基因挖掘、种质创新和育种改良以及豆科植物比较基因组学研究提供了重要借鉴和宝贵资源。这项研究邀请了澳大利亚默多克大学Rajeev K Varshney教授共同开展国际合作研究,他认为这次研究成果为公众提供了高质量的豌豆参考基因组,产生的基因组资源不仅有助于豌豆的遗传基础研究,以应对气候变化带来的挑战,还将促进豌豆优异基因的挖掘和优良品种的开发。此外,宗绪晓课题组及其合作团队还建立了豌豆遗传转化体系,利用CRISPR/Cas9基因编辑体系成功实现对豌豆PDS基因的编辑【6】。恰逢孟德尔诞辰200周年,豌豆高质量基因组和泛基因组的发布,以及豌豆基因编辑技术体系的建立将为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供有力的技术支撑。中国农业科学院作物科学研究所杨涛副研究员和刘荣助理研究员、中国科学院微生物研究所骆迎峰副研究员和胡松年研究员以及山东省农业科学院农作物种质资源研究所王栋助理研究员为论文的共同第一作者。中国农业科学院作物科学研究所宗绪晓研究员、中国科学院微生物所高胜寒特别研究助理、山东省农业科学院农作物种质资源研究所丁汉凤研究员、国际半干旱热带作物研究所和澳大利亚默多克大学Rajeev K Varshney教授为论文的共同通讯作者。中国科学院植物研究所葛颂研究员,西北农林科技大学徐全乐副教授、山东省农业科学院作物种质资源研究所李娜娜副研究员、云南省农业科学院何玉华研究员、青海大学刘玉皎研究员、江苏沿江地区农业科学研究所王学军研究员、四川省农业科学院项超副研究员以及中国农业科学院作物科学研究所研究生王晨瑜、李冠、黄宇宁、季一山、李孟伟,国际半干旱热带作物研究所Manish K Pandey和Rachit K Saxena博士,也参与了该项研究。辽宁省农业科学院李玲研究员,澳大利亚谷物种质库Bob Redden教授和美国农业部农业研究中心、华盛顿州立大学胡锦国教授对项目开展提供了重要帮助。豌豆基因组研究得到了科技部国家重点研发计划(2018YFD1000701/2018YFD1000700)、中国科学院青年创新促进会(2017140)、山东省农业品种改良项目(2019LZGC017)、中国农业农村部食用豆现代产业技术体系(CARS-08)、国家自然科学基金(31371695和31801428)、山东省农业科学院科技创新项目(CXGC2018E15)、作物种质资源保护(2130135)、山东省农科院科技创新项目产业团队农业科学(CXGC2016A02)、山东省现代农业产业技术体系粗粮创新团队(SDAIT-15-01)、中国农业科学院创新工程(ASTIP)和山东省农业科学院青年研究基金(2016YQN19)等项目的支持。
  • 学者研发便携式生物纳米孔测序仪 仅口袋大小就能测人类基因组
    p & nbsp & nbsp & nbsp & nbsp 《自然-生物技术》日前在线发表一篇论文,介绍了一种纳米孔装置。该装置仅有一个口袋大小,却可以测序和从头组装人类基因组。该研究报告了迄今为止最连续的人类基因组组装且仅使用了单一测序技术。 /p p   理解和解读人类基因组是现代医学的基石,人们一直希望可以尽可能多地测序基因组。此前,受速度、成本和测序系统有限等多种因素影响,这项工作令人望而生畏。虽然测序技术已有所改进,但要快速、低成本地组装人类基因组并保证高准确度和完整性,依然颇具挑战。 /p p /p p   为此,英国诺丁汉大学研究人员采用了一种便携式生物纳米孔测序仪,对人类GM12878细胞系基因组进行测序和组装,生成了91.2Gb的序列数据。利用这一方法,单个读长可长达882kb,使研究者能够分析过去利用最先进的测序方法也分析不了的人类基因组区域。填补了相关空缺,并提高其准确性。 /p p   据悉,“读长”指的是测序反应所能测得序列的长度,如果DNA序列长度高于“读长”,那么必须把DNA序列分割成长度在“读长”以内短序列才能测序。较长的“读长”,体现了测序技术的优势。 /p
  • 从人类基因组草图到完全图谱 ——论基因组重复片段研究
    从人类基因组草图到完全图谱——论基因组重复片段研究作者:李东卫,张玉波(中国农业科学院农业基因组研究所,“岭南现代农业”广东省实验室,深圳 518120)2001年发表的人类基因组草图并没有包含全部的基因组序列,直到二十年后,科学家们才正式宣布完成了人类全序列基因组图谱,这其中主要的技术障碍就是重复片段的测序工作。重复片段(segmental duplications,SDs)是指广泛存在于基因组中的大于1 kb且序列相似性超过90%以上的大片段。它们可以通过基因组重排及拷贝数变异产生新基因和驱动进化,其大量存在于子端粒中,并与哺乳动物细胞复制性衰老以及癌症等重要生物学过程密切相关,一直以来备受科学家关注。但是其序列特点使得常规的测序技术难以完全准确测出全部序列,是基因组组装工作的一个难点。人类基因组全图谱的完成将重复片段在生物体进化、延缓衰老、疾病治疗等方面的研究提供基础。本文将就重复片段的重要性,研究的技术难点,研究现状以及未来展望等方面展开论述。重复片段的重要性重复片段是基因组中序列高度相同的大片段,具有广泛的结构多样性。它们占人类参考基因组(T2T-CHM13)中的7.0%,长度为218 Mbp[2 ],在中心体及子端粒区域富集高达10倍。中心体所包含的5个典型重复为:α卫星,β卫星,CER卫星,γ卫星,CAGGG重复,以及重复子4。子端粒所包含的典型重复为:端粒相关重复(TAR)以及传统的(TTAGGG)n重复[4 ]。重复片段可以介导染色体重排,使常染色体和异染色体之间通过同源重组产生镶嵌类型的重复的染色质[5 ]。在最近新鉴定的人类重复片段中,Mitchell R等预测了182个新的候选蛋白编码基因,并使用T2T-CHM13基因组重构了重复基因(TBC1D3,SRGAP2C,ARHGAP11B),这些基因在人额皮质增生中具有重要作用,揭示了重复片段结构在人和他们近亲物种之间的巨大进化差异[6 ]。大量的染色体子端粒区含有重复片段[8 ]。复制性衰老被认为是一种抗癌机制,限制细胞增殖。长寿的有机体经历更多的细胞分裂,因此具有更高的产生肿瘤的风险。端粒酶能够增加端粒的长度,促进癌细胞不断增殖,因此长寿动物体细胞倾向于抑制端粒酶的活性,从而抑制肿瘤发生的风险[10 ]研究难点:大片段长度、多拷贝数、序列高度相似 重复片段的大的片段长度,多拷贝数以及序列的高度相似是长期以来其研究的难点。各种测序技术的发展致力于解决这个问题。重复片段长度范围是1到400 kb [12 ]。而且,标准的长读段校正工具,例如MUMmer 或Minimap2不能够有效的捕捉低相似的重复片段,也经常将重复片段与其它调控元件混淆[14 ],为重复片段的研究带来机遇。尤其是PacBio的HiFi读段,具有长读段的同时还具有较高的准确度。但是,很多重复片段的长度要比HiFi读段的平均长度要长,因此很难完全准确的进行组装[3 ]。染色体重排,尤其是染色质断裂常发生在高GC区域[16 ]。同时,在T2T-CHM13基因组基础上,Mitchell R等首次进行了全基因组重复片段的研究。与当前人类参考基因组(GRCh38)鉴定的167 Mbp复制片段相比,鉴定了更多的(218 Mbp)非冗余重复片段(图2 a, b)。新发现91%的重复片段能更好地代表人的拷贝数,通过与非人灵长类基因组相比,前所未有的揭示了人类和其它近亲在重复片段结构中的杂合性以及广泛的进化差异[17 ]。图2 T2T-CHM13中新鉴定的染色体内(a)与染色间(b)的重复片段[1 ]。利用重复片段解析衰老机制未来可期新组装的T2T-CHM13的拷贝数比GRCh38高9倍,因此它能更好的呈现人类拷贝数变异。通过鉴定新基因的拷贝数变异,可筛选相应的药物治疗靶点。例如,CHM13鉴定到LPA、MUC3A、FCGR2基因的拷贝数变异与疾病相关[1]。此外,对于尚具争议的疾病标志基因,例如乳腺癌中ESR1 基因[18],可以通过CHM13对其进行分子进化分析,进而鉴定其突变和扩增,确定其在乳腺癌中的作用。尽管端粒作为抗衰老靶标已研究多年,但是端粒长短变化与复制性衰老的关系仍不清楚。细胞减数分裂过程中端粒变短的机制是什么?重复片段拷贝数变异与端粒变短有无相关性?很多研究已证明端粒酶具有延长端粒长度的作用,具体的机制是什么?这些问题因此前端粒不能被准确测序而长期未解决。现在,人类基因组完全图谱已基本实现,相信这些谜团会很快解开。未来可以根据人类年龄增长过程中端粒重复片段的拷贝数变异,解析其抗衰老的机制。通过人为干预其拷贝数,可能用于探索生命的极限。1. Vollger MR, Guitart X, Dishuck PC, Mercuri L, Harvey WT, Gershman A, Diekhans M, Sulovari A, Munson KM, Lewis AM et al.Segmental duplications and their variation in a complete human genome. bioRxiv.2021:2021.2005.2026.445678.2. Prodanov T, Bansal V.Sensitive alignment using paralogous sequence variants improves long-read mapping and variant calling in segmental duplications. Nucleic Acids Research.2020 48(19).3. Bailey JA, Yavor AM, Massa HF, Trask BJ, Eichler EE.Segmental duplications: Organization and impact within the current Human Genome Project assembly. Genome research.2001 11(6):1005-1017.4. Courseaux A, Richard F, Grosgeorge J, Ortola C, Viale A, Turc-Carel C, Dutrillaux B, Gaudray P, Nahon JL.Segmental duplications in euchromatic regions of human chromosome 5: a source of evolutionary instability and transcriptional innovation. Genome research.2003 13(3):369-381.5. Giannuzzi G, Pazienza M, Huddleston J, Antonacci F, Malig M, Vives L, Eichler EE, Ventura M.Hominoid fission of chromosome 14/15 and the role of segmental duplications. Genome research.2013 23(11):1763-1773.6. Young E, Abid HZ, Kwok PY, Riethman H, Xiao M.Comprehensive Analysis of Human Subtelomeres by Whole Genome Mapping. PLoS genetics.2020 16(1):e1008347.7. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al.Initial sequencing and analysis of the human genome. Nature.2001 409(6822):860-921.8. Seluanov A, Chen ZX, Hine C, Sasahara THC, Ribeiro AACM, Catania KC, Presgraves DC, Gorbunova V.Telomerase activity coevolves with body mass not lifespan. Aging Cell.2007 6(1):45-52.9. Bromham L.The genome as a life-history character: why rate of molecular evolution varies between mammal species. Philos T R Soc B.2011 366(1577):2503-2513.10. Shay JW.Role of Telomeres and Telomerase in Aging and Cancer. Cancer discovery.2016 6(6):584-593.11. Sharp AJ, Locke DP, McGrath SD, Cheng Z, Bailey JA, Vallente RU, Pertz LM, Clark RA, Schwartz S, Segraves R et al.Segmental duplications and copy-number variation in the human genome. American journal of human genetics.2005 77(1):78-88.12. Hartasanchez DA, Braso-Vives M, Heredia-Genestar JM, Pybus M, Navarro A.Effect of Collapsed Duplications on Diversity Estimates: What to Expect. Genome Biol Evol.2018 10(11):2899-2905.13. Numanagic I, Gokkaya AS, Zhang L, Berger B, Alkan C, Hach F.Fast characterization of segmental duplications in genome assemblies. Bioinformatics.2018 34(17):i706-i714.14. Vollger MR, Dishuck PC, Sorensen M, Welch AE, Dang V, Dougherty ML, Graves-Lindsay TA, Wilson RK, Chaisson MJP, Eichler EE.Long-read sequence and assembly of segmental duplications. Nature methods.2019 16(1):88-94.15. Rhie A, McCarthy SA, Fedrigo O, Damas J, Formenti G, Koren S, Uliano-Silva M, Chow W, Fungtammasan A, Kim J et al.Towards complete and error-free genome assemblies of all vertebrate species. Nature.2021 592(7856):737-+.16. Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, Vollger MR, AltemoseN, Uralsky L, Gershman A et al.The complete sequence of a human genome. bioRxiv.2021:2021.2005.2026.445798.17. Zhu Y, Liu X, Ding X, Wang F, Geng X.Telomere and its role in the aging pathways: telomere shortening, cell senescence and mitochondria dysfunction. Biogerontology.2019 20(1):1-16.18. Tabarestani S, Motallebi M, Akbari ME.Are Estrogen Receptor Genomic Aberrations Predictive of Hormone Therapy Response in Breast Cancer? Iranian journal of cancer prevention.2016 9(4):e6565.
  • 中国农业科学院首次破解梅花鹿高质量全基因组序列
    近日,记者从中国农业科学院特产研究所获悉,该所和深圳农业基因组研究所,联合发布了梅花鹿高质量全基因组组装序列,并在梅花鹿耐受毒性食物的分子机制方面取得了重大进展。梅花鹿基因组序列的公布,开启了我省梅花鹿分子育种新时代,也为梅花鹿108个药用部位的物质基础解析,奠定坚实的基础。 据了解,中国梅花鹿全基因组测序计划于2010年启动,中国农业科学院特产研究所建设有全国唯一的梅花鹿种源基因库,特产所经过12年的不懈努力,终于成功组装了梅花鹿高质量基因组序列。基因组序列框架图谱的绘制,将大大加速中国梅花鹿的育种过程,对于寻找与鹿生产性能有关的SNP标记和功能基因,特别是寻找控制鹿茸再生的相关基因具有重大的意义。 我省是我国梅花鹿养殖的发源地和主产区,养殖梅花鹿历史悠久,文化底蕴深厚,产业发展基础好,特色优势明显。2021年,全省梅花鹿饲养量60万只,占全国总量的一半以上。梅花鹿作为我省农业十大产业集群之一,是我省重要的特色农业资源,梅花鹿产业凭借资源优势不断成长为我省畜牧业经济的新兴增长点,成为农民持续增收的重要支撑。 特产研究所此次破解梅花鹿高质量全基因组序列,不但奠定了中国梅花鹿功能基因组学、蛋白组学和分子遗传育种的研究基础,还大大促进了我省梅花鹿基因库、梅花鹿遗传资源保种场和核心育种场建设,对于提高吉林梅花鹿良种纯度及种用和生产性能,刺激我省梅花鹿养殖业、药理功效科技研发、加工业快速发展有着巨大促进作用。
  • 中国学者领衔,联合119位学者,人类“泛基因组”成果登上Nature封面!
    人类基因组计划于2003年完成了第一个完整的人类基因组序列,在具有里程碑意义的人类基因组计划的第一份基因组草图发布20多年后,由国际人类泛基因组参考联盟牵头,由美国国立卫生研究院国家人类基因组研究所 (NHGRI) 资助的研究人员发布了一份人类“泛基因组”草稿——这是一个新的、可用的基因组学参考,它结合了来自不同祖先背景的 47 个人的遗传物质,以便更深入、更准确地理解全球基因组多样性。值得一提的是,该篇Nature封面总共有119位学者,第一作者为中国学者Wen-Wei Liao,通讯作者分别为Erik Garrison, Tobias Marschall, Ira M. Hall, Heng Li, Benedict Paten。Figure 1. Nature封面什么是泛基因组?它是一组来自许多个体的基因组,放在一起以显示序列相同或不同的位置。人类泛基因组草案由47个基因组组成,该项目将持续到 2024 年,届时研究人员计划发布包含 350 个人基因组信息的最终泛基因组。目前,由于依赖于单一参考基因组,一些变异对研究人员来说基本上是不可见的。等等,什么是参考基因组?它是一种地图。当研究人员对某人的DNA进行测序时,他们会根据它们在参考基因组中的适合位置得到很多片段。这有点像通过查看解剖学教科书来查看每块骨头适合的位置来组装骨架。对于绝大多数骨骼来说,这很好,但有些人有额外的骨骼,例如教科书中没有的颈肋骨。目前,当科学家绘制来自患者的序列图时,总是有一小部分序列,有时是相当大的一部分,无法被绘制出来。参考基因组基于谁的DNA?参考基因组本应由20名匿名捐赠者的DNA混合而成,但最终,其中73%来自一个人。后来的分析表明,那个人是非裔美国人,而且第二大捐助者(大约6%)主要是东亚血统。科学家已经对数百万个基因组进行了测序,为什么还没有泛基因组?这是因为测序的许多基因组远未完成——事实上,当人类基因组计划宣布“完成”时,单一参考基因组仅完成了92%。当时只能对短的DNA片段进行测序,而且由于大部分基因组是高度重复的,因此许多这些小片段无法重新组装。泛基因组项目使用了产生更长片段的方法,称为“读取”。因此,泛基因组基于99%完整的极高质量序列。我们为什么需要它?——【了解基因组变异】每个人的基因组略有不同——与下一个人相比平均相差约 0.4%——了解这些差异可以深入了解他们的健康状况,有助于诊断疾病、预测医疗结果和指导治疗。使用泛基因组参考将提高科学家在未来研究中检测和理解变异的能力。Figure 2. 人类泛基因组通常,当科学家和临床医生研究个体的基因组以寻找变异时,他们会将个体的 DNA 与标准参考的 DNA 进行比较,以确定一个或多个碱基对的差异所在。到目前为止,参考基因组主要由每个人类染色体的单个序列表示,主要来自一个个体。但是,这个参考已有将近 20 年的历史,并且从根本上受到限制,因为它不能代表人类群体中存在的丰富的遗传变异。这在基因组分析中引入了一个称为参考偏差的问题。相比之下,新的泛基因组是一个参考,它结合了来自不同祖先背景的 47 个个体的基因组。泛基因组在序列具有相同碱基的区域看起来像线性参考,并扩展以显示存在差异的区域。它同时代表了人类基因组序列的许多不同版本,并为科学家提供了一个更准确的比较点,用于比较某些人群中存在的变异,而不是其他人群中存在的变异。在泛基因组参考中添加的 1.19 亿个新碱基中,大约有 9000 万个来自结构变异。结构变异很复杂,可能是序列倒置、插入、缺失或串联重复——两个或多个碱基重复多次的片段。这些新碱基将帮助研究人员研究基因组中以前没有参考的区域,并有可能在未来的研究中将结构变异与疾病联系起来。与使用标准参考的检测相比,使用泛基因组参考进行基因组分析可将结构变异的检测提高 104%。由于泛基因组中存在的数据量增加,泛基因组参考还提高了调用小变体(那些只有几个碱基长)的准确性约 34%。每个人都携带一对染色体——一组遗传自母亲,一组遗传自父亲。泛基因组参考中的个体基因组包含单倍型解析信息,这意味着它可以自信地区分两组父母的染色体——这是一项重大的科学壮举。掌握这些信息将有助于科学家更好地了解各种基因和疾病是如何遗传的。图 1. 呈现 47 个准确且接近完整的多样化二倍体人类基因组组合【创建泛基因组】通过开发先进的计算技术将多个基因组序列对齐到一个称为泛基因组图的结构中的可用参考,使泛基因组成为可能。Paten 和 UCSC 计算基因组学实验室的研究人员帮助领导 HPRC 努力开发创建这种泛基因组图结构所需的算法方法。由于该项目使用的方法,泛基因组参考中的所有基因组都具有极高的质量和准确性,覆盖了每个人类基因组的 99% 以上,准确率超过 99%。通过 Asri 的管道后,各种基因组通过复杂的算法方法编译成泛基因组图结构。在视觉上,图形基因组允许研究人员将各种参考序列中的差异视为其他共享路径中的发散区域。图 2. 组件的转录组注释图 3. 泛基因组图代表不同的变异图 4. 泛基因组图评估【建立可访问的资源】泛基因组草案中的所有前 47 个二倍体基因组都来自参与千人基因组计划 (1000G) 的个人,这是一项有影响力的工作,根据公开同意的样本创建了一个常见的人类遗传变异目录,并于 2015 年完成。这些样本的同意状态允许任何研究人员访问资源,而无需通常伴随基因组研究的隐私障碍,目的是让尽可能多的人可以访问泛基因组。除了关注可访问性外,HPRC 项目还有一个专门的道德团队,专注于该项目的社会和法律影响。他们正在努力预测具有挑战性的问题并帮助指导知情同意,优先研究不同样本,探索与临床采用有关的可能监管问题,并与国际和土著社区合作,将他们的基因组序列纳入这些更广泛的努力。图 5. 可视化复杂的泛基因组位点图 6. 泛基因组辅助分析短读 WGS 数据的性能提升【继续遗产和未来的工作】人类泛基因组是加州大学圣克鲁兹分校的科学家为了解构成人类生命基础的生物密码而进行的数十年努力的延续。研究人员正在朝着到 2024 年完成完整泛基因组的目标取得进展。该团队正在招募新个体来代表一些未包括在千人基因组计划中的人群,尤其是中东和非洲血统的人群。除了完成最终的泛基因组参考,研究人员还在努力组建一个国际人类泛基因组项目,该项目将与世界各地的研究人员建立合作伙伴关系。这些伙伴关系将包括双向技能和知识交流,旨在将创建高质量参考基因组所需的技能和技术交到全球研究人员手中,以便他们能够开展自己的研究。原文链接:https://www.nature.com/articles/s41586-023-05896-x
  • PacBio推出长读长测序系统Revio|将基于HiFi的人全基因组测序推进至1000美元时代!
    全新设计的 SMRT Cell、计算和新系统架构的重大进步将使 Revio 能够显著提高通量并降低测序成本,同时利用 HiFi 的强大功能实现卓越的准确性和直接甲基化检测。2022年10月25日PacBio宣布推出 Revio 长读长测序系统,这将使客户能够显著扩展他们对 PacBio 闻名于世的 HiFi 测序技术的使用。Revio 旨在为客户提供每年以30倍覆盖率对多达1300个人类全基因组进行测序的能力,每个HiFi人全基因组测序成本不到1000美元。 凭借这种通量和定价,PacBio 相信 Revio 将使 HiFi 测序能够用于人类遗传学、癌症研究、农业基因组学等方面的大型研究。PacBio 总裁兼首席执行官Christian Henry:“我们的客户借助 HiFi 测序改变了基因组学的认知。Revio 将通过增加高通量和可负担性来进一步释放这种力量。我们设计了一个全新的 SMRT Cell,其密度是我们现有 SMRT Cell 8M 的三倍,它具有2500万个 ZMW。Revio 能够同时并行多达4个 SMRT Cell,它总共可以同时提供多达1亿个 ZMW 进行单分子实时测序。结合我们计算方面的重大进步,Revio 将提供更短的运行时间,并将 HiFi 数据通量增加15倍。我期待看到研究人员可以借助 Revio 的强大功能有新的发现。”科学家们已经在 PacBio 的 Sequel IIe 系统上通过 HiFi 测序实现了诸多“第一” :第一个完整的端粒到端粒人类基因组组装(Nurk 2022),罕见疾病队列中第一个单倍型解析的甲基化组(Cheung 2022), 首次对长读长结构变异的群体调查(All of Us Research Program)、第一个单细胞水平完整的转录本异构体目录(Al'Khafaji 2021)和第一次完整组装高度复杂的燕麦基因组(European Seed 2020)。Revio 系统使用了相同的开创性 HiFi 试剂 – 产生准确的原始长读长,均匀的测序覆盖,无与伦比的变异检测准确率和组装完整性,以及准确的 DNA 甲基化检测, 这一切都在更大的通量规模上实现。Revio 将是 PacBio 的第一个采用最先进的 NVIDIA GPU 的系统,与 Sequel IIe 相比,Revio 的计算能力提高了20倍。除了提供加速 basecalling来满足 Revio 更高的吞吐量之外,支持 AI 的计算还将集成深度学习算法以检测标准测序库中的 DNA 甲基化,以及 DeepConsensus,一种与 Google Health 开发的深度学习方法,达到提高 HiFi 的产量和测序准确性。与 Sequel IIe 系统相比,Revio 系统将耗材的使用量减少了一半,并在工作流程和便利性方面进行了重大改进。Revio 可以在当下样本测序运行时同时设置后续样本的运行,这为操作员提供了更大的日程安排灵活性,可以在一天中的任何时间加载运行,而不会导致与耗材相关的仪器停机。堪萨斯城儿童慈善中心基因组医学中心主任Tomi Pastinen 医学博士:“在我们的儿童基因组答案 (GA4K) 计划中,HiFi 基因组测序在未解决的罕见疾病样本中显示出超越当代基因分析的真正进步。以更低的成本提高 Revio 系统的吞吐量将加快 GA4K 项目的样本解答速度。”Corteva Agriscience 基因组学技术经理Gina Zastrow-Hayes 博士:“来自 PacBio 的新 Revio 测序系统将成为 Corteva 基因组学工具箱的关键组成部分。长读长测序使鉴定复杂植物基因组的表征成为可能,现在 Revio 的高通量能力将使我们能够将 HiFi 技术更广泛应用到农业生物应用中。”Revio 的美国目录价格为77.9万美元。PacBio 现在正在接受订单,并预计在2023年第一季度开始交付使用。PacBio 还在其网站上发布了一份演示文稿,其中包含有关 Revio 的更多详细信息。有兴趣的人士可以阅读 PacBio 的投资者关系网站上的演示文稿,以及产品信息。
  • 1636万!崖州湾国家实验室大型仪器设备和单细胞测序、油菜基因组三代测序及分析服务采购项目
    一、项目基本情况1.项目编号:HXJC2024HG/047项目名称:崖州湾国家实验室大型仪器设备采购项目2(第一部分)预算金额:896.000000 万元(人民币)采购需求:本次招标采购共分为2个包,每包遴选出1家符合要求的供应商,为采购人提供仪器设备的供货服务。具体分包情况如下表:包号设备名称单位数量是否可采购进口产品(是/否)是否需要授权函(是/否)核心产品(是/否)最高投标限价(万元)1步入式植物培养室套2是是是4662小麦小区收割机台2是是是430 注:符合条件的供应商可以投1包或多包,并分包编制投标文件。合同履行期限:第1包:合同签订后7个月内供货并安装完毕。第2包:合同签订后10个月内供货并安装完毕。本项目( 不接受 )联合体投标。2.项目编号:HXJC2024FG/041项目名称:崖州湾国家实验室油菜基因组三代测序及分析服务采购项目预算金额:400.000000 万元(人民币)采购需求:本次招标拟择优选择1家合格的供应商,根据采购人要求,为采购人提供油菜基因组三代测序及分析服务,具体服务内容如下:(1)Survey建库测序分析项目序号项目类型单价最高限价子项目1Survey提取建库100元/样子项目2Survey测序1100元/样子项目3Survey信息分析700元/样 (2)油菜样本的PacBio HiFi测序组装项目序号项目类型单价最高限价子项目1三代提取和建库1800元/库子项目2PacBio Revio测序12000元/样子项目3基因组组装和挂载8000元/样 (3)基因组注释及泛基因组构建项目序号项目类型单价最高限价子项目1基因组注释4000元/样子项目2泛基因组构建2000元/样 合同履行期限:自合同签订后两年。本项目( 不接受 )联合体投标。3.项目编号:HXJC2024FG/042项目名称:崖州湾国家实验室单细胞测序服务采购项目预算金额:340.000000 万元(人民币)采购需求:本次招标拟择优选择1家合格的供应商,根据采购人要求,为采购人提供单细胞测序分析技术服务。合同履行期限:自合同签订后360日内。本项目( 不接受 )联合体投标。二、获取招标文件时间:2024年06月13日 至 2024年06月20日,每天上午9:00至11:30,下午13:30至16:00。(北京时间,法定节假日除外)地点:中招联合招标采购平台(http://www.365trade.com.cn)。方式:线上购买电子版招标文件,详见“特别告知”。售价:¥600.0 元,本公告包含的招标文件售价总和三、对本次招标提出询问,请按以下方式联系。1.采购人信息名 称:崖州湾国家实验室     地址:三亚市崖州区还金路8号        联系方式:余老师 13301296867      2.采购代理机构信息名 称:北京华夏京诚咨询有限公司            地 址:北京市海淀区西直门北大街甲43号金运大厦B座802室            联系方式:王建保、刘雅萌、高宏鹏、马建军010-82582703-805/816/809            3.项目联系方式项目联系人:王建保、刘雅萌、高宏鹏、马建军电 话:  010-82582703-805/816/809
  • 人类基因组计划完成15周年——从个人基因组到精准医疗
    本文作者基因组学科技工作者田埂,原文题目&ldquo 写给人类基因组计划完成十五周年:从一个人的基因组计划到精准医疗&rdquo 。   &ldquo 美国总统克林顿于当地时间26日上午10时在白宫举行的记者招待会上郑重宣布,由一批国际科学家组成的人类基因组研究计划已经完成人类基因组草图。英国首相布莱尔以卫星电视的形式参与了这个发布会。克林顿在评价这一历经10年时间完成的科学成果的深远意义时说,&lsquo 人们将世世代代记住这一天&rsquo 。他感谢美国、英国、德国、日本、中国和法国的上千名科学家为取得将这一开辟新纪元的成果所作出的贡献。&rdquo   田埂教授   刚刚看到这个2000年6月26日的新闻,突然发现不知不觉时间已经过去了15年。那个时候人们对刚刚完成的人类基因组草图充满了期盼:通过人类基因组信息帮助人们克服疾病,达到人们的终极健康长寿的需求。   在人类基因组计划完成的这15年里,那些主要参与国美国、英国、中国都发生了什么?   15年后的今天人们所能感受到的人类基因组计划的影响究竟是个什么样子?   未来的人类基因组研究和应用在往哪个方向发展?   15年后的今天,人们依然充满了期望。   美国在人类基因组计划完成后的变化   人类基因组计划组织和塞雷拉基因组公司兵分两路   在美国,人类基因组计划完成以后,原先竞争的两大阵营:人类基因组计划组织和塞雷拉基因组(Celera Genomics)公司,分别走向了两个方向:人类基因组计划原先的参与Whitehead Institute(后来的著名的Broad Institute)、美国能源部基因组中心、华盛顿大学医学基因组测序中心、贝勒大学医学基因组测序中心等11个基因组中心继续开展各类大型的基因组研究计划 塞雷拉基因组公司,则转向了心血管病和个体化医疗管理等商业方向。   可以说美国的人类基因组研究有一个贯穿始终的目的,就是将人类遗传和基因组信息应用到医疗和健康领域。因为科学家们认识到从第一个人类遗传病亨廷顿氏舞蹈症(Huntington&rsquo s Disease,又称为慢性遗传舞蹈病)的基因被定位,这种通过家系研究定位遗传病的方式,在没有对人类基因组序列的深刻认识,没有对人类遗传规律深刻的了解情况下,医学遗传学研究的速度将无法从本质上提高。   在这个认识的基础上,美国先后启动了&ldquo 国际人类基因组单体型图计划&rdquo (The International HapMap Project,HapMap计划) &ldquo 癌症基因组图集&rdquo (The Cancer Genome Atlas,TCGA)计划 &ldquo DNA元件百科全书&rdquo 计划(Encyclopedia of DNA Elements,简称ENCODE) 千人基因组计划(1000 Genome Project),以及最近炒的火热的&ldquo 精准医疗计划&rdquo (The Precision Medicine Initiative)。这些计划投资规模以百亿美元计,参与科学家以数万人计。可以说美国人在朝着既定的目标一步一步向前发展,脉络清晰,步骤明确,并且从人才培养到技术支撑,从领导科学家选拔到商业运行模式上的探索,都走在世界的前面。   在这15年的时间里,参与人类基因组计划的几位领导科学家也有了各自的发展:当时的领导科学家Francis Collins已经是现任NIH的主任 Whitehead Institute研究所的主任Eric Lander完成了将Whitehead Institute从MIT和Harvard的独立出来的工作,已经成为美国最大的基因组研究中心,他本人也是奥巴马总统的科技参赞,可以参与美国的科技政策决策 &ldquo 科学狂人&rdquo 塞雷拉基因组公司创始人Craig Venter则独辟蹊径,虽然塞雷拉基因组公司已经不再复当年风光,但是Craig Venter却先后成为第一个合成原核生物基因组的人,第一个用计算机模拟生物整个代谢途径的人,第一个提出海洋基因组学研究并实施的人。   与此同时,美国在基因组研究技术上也领先于世界,从人类基因组计划所使用的ABI和Amersham的第一代测序仪,到HapMap计划使用的Affymetrix和Illumina公司的芯片,再到千人基因组和TCGA以及Encode计划使用的Illimina公司的第二代测序系统,以及Pacbio的第三代测序系统,美国人在测序和基因组技术上的创新和积累,依然领先于世界。   英国在人类基因组计划完成后,率先启动十万人基因组项目   再看看英国:英国人对基因组研究的热情始终如一,从Frederick Sanger先生发明第一代测序系统,到首先参与美国提出的&ldquo 人类基因组计划&rdquo ,贡献仅次于美国,英国有欧洲大陆最大的基因组研究中心&ldquo Sanger Institute&rdquo ,是第二代测序技术的参与发明国,共同提出和启动了&ldquo 千人基因组计划&rdquo ,共同提出并启动和领导了&ldquo 国际肿瘤基因组计划&rdquo ,率先启动了Genome England的十万人基因组项目,间接影响到美国的&ldquo 精准医疗计划&rdquo 的提出。   英国人在人类遗传学上的投入也不遗余力,英国有全世界研究人类遗传病最好的研究团队,并且英国有政府引导,科学家和企业共同参与的举国基因组研究体制,可以说虽不及美国人在人类基因组研究上的布局深刻,但是英国总能在某些领域里有独特的见解和布局,通过自己的方式影响着世界,并且不得不说的是,英国在基因组研究领域对中国科学家毫无保留的帮助的无私情怀,从捐赠中国华大基因研究中心测序仪,到在各种国际合作中为中国提供便利和帮助,以及帮助中国培养基因组学研究人才,可以说中国的基因组学发展处处都有英国的帮助。   中国在人类基因组计划完成后,积极探讨&ldquo 中国版的精准医疗计划&rdquo   再看看中国这15年人类基因组学的研究进展。首先看看当时的报道&ldquo 1999年的日历翻开了。杨焕明说,要干就要干大,再难也要干大。于是,杨焕明、汪建、于军凑出了自己积蓄的200多万元。他们用这笔钱,购买了一台&ldquo 377&rdquo 型测序仪和一台美国产的毛细管测序仪。在不到半年的时间里,他们递交了人类基因组序列70万个碱基的测序结果,并做了热泉菌测序。这些成果,引来了国际同行的瞩目。&rdquo   6月29日,记者来到了中科院遗传所人类基因组中心。在实验室,记者看到,工作平台是用集装箱搭成的。在平台上,有三根玉米棒,旁边有一行字:穷棒子精神永放光芒!据介绍,深居京郊的这些科研人员,收入不高,也没有娱乐,在&lsquo 1%&rsquo 测序中,他们测序精确,但相应的测序成本却只有美国等国家测序成本的四分之一。&rdquo &ldquo &lsquo 中心&rsquo (作者注:北京华大基因研究中心)执行主任汪建对记者说:&ldquo 中国虽然只做了1%,但意义重大。中国科研人员在测序过程中,不仅增加了设备,而且培养了技术。21世纪生物产业发展的机遇,中国没有失去。&rdquo 他意味深长地说。&rdquo   随后,中国科学院成立了&ldquo 中国科学院北京基因组研究所&rdquo ,专注基因组研究,中国也参与了HapMap计划,同时发表了一系列植物和动物的基因组学研究成果,但从那以后中国的基因组学研究一度遭到寒冬,在大约三年的时间里,鲜有大型研究项目启动,研究成果也较少。   2007年6月华大基因南下深圳,成立了&ldquo 深圳华大基因研究院&rdquo ,深圳华大抓住了二代测序发展的关键时期,用独特的运行模式,先后完成了&ldquo 炎黄一号&rdquo 第一个黄种人基因组测序研究,发起并实施了&ldquo 炎黄九九基因组研究项目&rdquo ,共同参与设计和启动&ldquo 千人基因组计划&ldquo ,共同参与和发起&ldquo 国际肿瘤基因组计划&rdquo ,共同发起&ldquo 中国肿瘤基因组协作组&rdquo ,上个月华大发表了&ldquo 炎黄一号&rdquo 单倍型图的研究成果,将黄种人的基因组组装成了最完整的人类基因组单倍型图。   这些研究计划开展和研究成果陆续发表的同时,华大还培养了大批基因组科技人才,这些人才活跃在国内外基因组研究和产业化的各个领域。在有感于产业链上游测序仪的限制后,深圳华大于2012年完成了对美国Complete Genomics公司的收购,打通了产业链上下游。当然,这些大型的研究计划,都得到了深圳市政府和国家科技部等的支持。   展望:把握住基因组学发展的脉络,真正实现精准医疗的设想   在英国和美国相继提出自己的大型基因组研究计划后,中国也在积极讨论&ldquo 中国版的精准医疗计划&rdquo ,作为基因组学科技工作者我们也期望中国的&ldquo 精准医疗计划&rdquo 把握住基因组学发展的脉络,顺应人类基因组学研究发展的规律,真正实现精准医疗的设想。   回顾人类基因组计划完成这15年历史,我们会发现,在当年人类基因组计划的基础上,已经逐步建立起来的人们使用基因组和遗传信息来指导健康生活和医疗的路线图,相信在下一个15年,我们再笑谈15年里人类基因组研究和应用的发展时,我们可以欣慰的告诉自己,我为人类了解自己的基因组并应用做出了贡献。最后,由衷感谢参与人类基因组计划的所有科学家和科技工作和的工作,更加感谢中国参与过人类基因组计划的科学家和科技工作者们,是你们的辛苦工作让国人有机会更早的享受到基因组学进展为我们的健康生活和医疗带来的好处。   备注:作者田埂系基因组学科技工作者。
  • 三代基因测序:组装算法和软件研发获突破
    DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业。测序技术的应用也扩展到了生物、医学、制药、健康、农林、园艺、花卉、环保、法医等许多领域,并成为一项与我们衣食住行密切相关的高技术产业。据最新统计,2012年全球基因测序市场的产值已超过百亿,按最近几年增长速度,预计2017年市场产值将加倍。在测序产业占世界市场份额第一的正是总部设在深圳的我国华大基因研究院。因此可以说,基因测序在我国生物科技领域具有非常重要的战略意义。   &ldquo 第三代测序技术&rdquo 的研发已有近十年时间,商业化的第三代测序仪上市也有三年。但目前测序市场仍为二代测序技术所垄断(我国顶级科研机构和商业公司所拥有的三代测序仪可能仅有数十台)。三代测序技术产生的读段更长,测序成本更低,其取代二代技术是测序技术发展的必然趋势。然而由于三代测序技术错误率高,现有的组装软件多是对第二代测序数据组装软件的&ldquo 修补&rdquo 而并没有充分考虑到三代测序技术的数据特征。事实上,基因组装算法问题被广泛认为是计算生物学和生物信息学领域最复杂的计算难题之一,也是目前阻碍基因测序产业从二代技术升级到三代技术最大的技术障碍。   最近,美国马里兰大学 Chengxi Ye, James A. Yorke, Aleksey Zimin 等与中国科学院昆明动物研究所遗传资源与进化国家重点实验室马占山研究员在这一领域的合作研发取得新突破。该研究团队在一篇题为DBG2OLC: Efficient Assembly of Large Genomes Using the Compressed Overlap Graph 的文章中引入了一种新的针对三代测序技术的基因组装算法,并开发出一款软件(DBG2OLC)。另外作者(Ye et al. 2011, 2012)于2011年发布的SparseAssembler曾经比当时主流的基因组装软件节省90%的内存空间,而其计算时间和组装质量却毫不逊色。著名的SOAPdenovo的升级版,也是目前最广泛应用的基因组装软件SOAPdenovo2即采用了SparseAssembler算法。   多组测序数据的测试表明:与目前用于三代测序最优秀的一些基因组装软件(例如PacBio2CA, HGAP, ECTools)相比,DBG2OLC在计算时间和内存空间的消耗通常仅为其它算法的1/10。理论上,DBG2OLC在时间和空间的使用上相对其它同类软件可减少达1000倍。例如组装关键步骤之一的&ldquo 两两比对&rdquo 计算,采用一组由 PacBio提供的人类基因组数据,DBG2OLC 使用一台普通PC仅用了6小时完成。而同样计算,Pacific Biosciences所报道的时间为 405000 CPU小时,而且是在Google的计算集群上完成。因此,DBG2OLC 算法基本解决了目前三代测序技术所面临的计算技术挑战,从而为推进基因测序技术的产业升级奠定了良好的技术基础。
  • 【精彩视频回放】第二届“基因测序技术发展及前沿”专题网络研讨会· 农业基因组篇
    p style=" text-indent: 2em " strong 基因测序技术 /strong 是基础生物学研究的重要工具,是临床分子诊断的重要手段,是探索生命奥秘的科学技术。 /p p   仪器信息网第二届“基因测序技术发展及前沿”专题网络研讨会于5月28日成功召开。 “ strong 农业基因组 /strong ”专场报告精彩纷呈、亮点多多,小编也是第一时间送出精彩视频回放。错过直播的小伙伴们,赶快观看学习吧~ /p p style=" text-align: center " strong span style=" color: rgb(0, 112, 192) " 报告题目:《基因组的组装和基于高通量测序的表观遗传学应用》 /span /strong /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 400px height: 513px " src=" https://img1.17img.cn/17img/images/201905/uepic/e36ec2c6-3eb9-4eeb-bb21-2353562660b8.jpg" title=" 刘贵明.jpg" alt=" 刘贵明.jpg" width=" 400" height=" 513" border=" 0" vspace=" 0" / /p p    span style=" font-family: 楷体, 楷体_GB2312, SimKai " 刘贵明,博士,北京市农林科学院研究员。 /span /p p   北京市农林科学院刘贵明研究员主要从事高通量测序和表观遗传研究。刘老师介绍了做参考基因测序的5个不同基因测序平台,分别对这些平台的优缺点进行了比较,以及对测序的思路进行对比。在基因组组装方面,针对细菌、作物参考基因组的组装方法和策略、SV变异的分析、捕获测序、SMRT-Cappable-seq等展开了探讨 在表观遗传学方面,建立了4个基础的表观遗传技术——DAP-seq、ATAC-seq、m6A-seq、CrY2H-seq,并探讨该技术在表观遗传学方面的应用。 a href=" https://www.instrument.com.cn/webinar/Video/play/105202" target=" _self" strong span style=" color: rgb(255, 0, 0) " 报告视频精彩回放 /span /strong /a /p p style=" text-align: center "    strong span style=" color: rgb(0, 112, 192) " 报告题目:《基于高通量测序的分子育种平台开发和应用》 /span /strong /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 350px height: 494px " src=" https://img1.17img.cn/17img/images/201905/uepic/7c6bcd43-c462-46ca-97e2-119fa3b9fbf6.jpg" title=" 肖世俊.jpg" alt=" 肖世俊.jpg" width=" 350" height=" 494" border=" 0" vspace=" 0" / /p p    span style=" font-family: 楷体, 楷体_GB2312, SimKai " 肖世俊,武汉理工大学计算机学院副教授,西藏自治区农牧科学院高层次柔性引进人才。 /span /p p   世界十大种子公司,中国企业无一上榜。洋种子占领中国市场,国内种业公司多而不强,我们国家的育种还处于传统育种水平,与发达国家还有一定差距。基因测序技术的进步和基因组学的发展,为我国的育种工作提供了更多的技术和方法。鉴于此,武汉理工大学肖世俊研究员分享了其实验室基于高通量测序的分子育种平台的开发和应用,分析了基于高通量测序技术的分子育种技术难点,并提供了整套一体化的分子育种解决方案。 a href=" https://www.instrument.com.cn/webinar/Video/play/105203" target=" _self" strong span style=" color: rgb(255, 0, 0) " 报告视频精彩回放 /span /strong /a /p p style=" text-align: center " strong span style=" color: rgb(0, 112, 192) " 报告题目:《Illumina农业基因组学研究解决方案》 /span /strong /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 400px height: 400px " src=" https://img1.17img.cn/17img/images/201905/uepic/63bdfd2f-0dd2-4e93-a5e8-fe0595bfc26b.jpg" title=" 曹友培.jpg" alt=" 曹友培.jpg" width=" 400" height=" 400" border=" 0" vspace=" 0" / /p p    span style=" font-family: 楷体, 楷体_GB2312, SimKai " 曹友培,Illumina资深测序行业经理 /span /p p   农业基因组学已经并将继续推动现代农业的可持续发展,为全世界人口增长所带来的挑战提供解决方案。测序和芯片的联合使用能大大够推进农业基因组学的研究。全球十大创新公司Illumina资深测序行业经理曹友培介绍了Illumina农业研究整体解决策略,重点介绍了Illumina的芯片技术和新一代测序(NGS)技术在农业基因组学研究中应用,以及如何帮助研究人员和育种家培育出更加健康并且高产的作物和牲畜。 a href=" https://www.instrument.com.cn/webinar/Video/play/105200" target=" _self" strong span style=" color: rgb(255, 0, 0) " 报告视频精彩回放 /span /strong /a /p p style=" text-align: center " strong span style=" color: rgb(0, 112, 192) " 报告题目:《聚焦三维基因组学及基因组学研究进展》 /span /strong /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 400px height: 494px " src=" https://img1.17img.cn/17img/images/201905/uepic/5c28e829-f7f7-4069-9c80-d85217aa698d.jpg" title=" 张玉波.jpg" alt=" 张玉波.jpg" width=" 400" height=" 494" border=" 0" vspace=" 0" / /p p    span style=" font-family: 楷体, 楷体_GB2312, SimKai " 张玉波,博士,国家千人计划青年项目专家,中国农业科学院农业基因组研究所研究员,博士生导师,动物功能基因组学创新团队首席科学家。 /span /p p   三维基因组学是后基因组学时代的一个新的研究领域,其主要研究内容为真核生物染色质空间构象,及其生物学效应。通过该项技术,人们能对染色质的折叠和三维结构、转录调控机制、复杂性状、信号传导通路和基因组的运行机制等一系列重要问题进行更深入的研究,为系统解读生命百科全书和精准生物学的实施奠定坚实基础。 /p p style=" text-align: center " strong span style=" color: rgb(0, 112, 192) " 报告题目:《高质量基因组的构建与应用》 /span /strong /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 400px height: 439px " src=" https://img1.17img.cn/17img/images/201905/uepic/41af5e03-d347-424c-9acb-6d2a8ef6fee0.jpg" title=" 梁承志.jpg" alt=" 梁承志.jpg" width=" 400" height=" 439" border=" 0" vspace=" 0" / /p p   span style=" font-family: 楷体, 楷体_GB2312, SimKai "  梁承志,博士,中国科学院遗传与发育生物学研究所研究员,2012年入选中科院引进杰出技术人才项目,担任中科院遗传发育所基因组分析平台首席科学家。 /span /p p   目前,单分子长片段测序技术已成为构建高质量基因组的主流技术。中国科学院遗传与发育生物学研究所梁承志研究员利用单分子测序数据构建了多个高质量的参考基因组,并对这些基因组的进化进行了初步研究。此外,梁老师团队开发了一个利用单分子测序长片段进行基因组复杂区域组装的新方法HERA。HERA大大提高了基因组的质量,为功能基因组研究奠定了一个坚实的基础。 a href=" https://www.instrument.com.cn/webinar/Video/play/105201" target=" _self" strong span style=" color: rgb(255, 0, 0) " 报告视频精彩回放 /span /strong /a /p p    span style=" font-family: 楷体, 楷体_GB2312, SimKai " 虽然会议已经结束,但是精彩仍在继续,仪器信息网已经将部分报告老师的现场讲座视频上传到仪器信息网网络讲堂,想要重复学习或者错过参与会议直播的网友,可以点击报告视频精彩回放进行学习与分享。 /span /p p    strong 附: /strong a href=" https://www.instrument.com.cn/news/20190529/486095.shtml" target=" _self" strong span style=" color: rgb(0, 112, 192) " 【精彩视频回放】第二届“基因测序技术发展及前沿”专题网络研讨会· 医疗健康 /span /strong strong span style=" color: rgb(0, 112, 192) " 篇 /span /strong /a /p
  • 北京基因组研究所预算665万修购项目之仪器设备(一)招标
    p   2017年6月15日,中国科学院北京基因组研究所对2017年度修购项目之仪器设备(一)进行公开招标。详情如下: /p p   项目名称:中国科学院北京基因组研究所2017年度修购项目之仪器设备(一) /p p   项目编号:OITC-G17031171 /p p   项目联系方式: /p p   项目联系人:王军 /p p   项目联系电话:010-68725599-8440 /p p   采购单位联系方式: /p p   采购单位:中国科学院北京基因组研究所 /p p   地址:北京市朝阳区北辰西路1号 邮编:100101 /p p   联系方式:徐玮老师 010-84097417 /p p   代理机构联系方式: /p p   代理机构:东方国际招标有限责任公司 /p p   代理机构联系人:王军 68725599-8440 /p p   代理机构地址: 北京市海淀区阜成路67号银都大厦15层 邮  编:100142 /p p   一、采购项目的名称、数量、简要规格描述或项目基本概况介绍: /p table align=" right" border=" 1" cellspacing=" 0" cellpadding=" 0" tbody tr class=" firstRow" td style=" padding: 0cm 5.4pt border: 1pt solid windowtext border-image: none " p style=" text-align: center " 包号 /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 设备名称 /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 主要用途摘要 /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 数量(套) /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 预算 /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 交货期 /p /td td style=" border-width: 1pt 1pt 1pt medium border-style: solid solid solid none border-color: windowtext windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 交货地点 /p /td /tr tr td style=" border-width: medium 1pt 1pt border-style: none solid solid border-color: rgb(0, 0, 0) windowtext windowtext padding: 0cm 5.4pt " p style=" text-align: center " 1 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 基因组结构变异分析系统 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 能够配合研究所现有基因组测序平台设备,完成基因组组装和染色体结构变异分析。系统采用微流控技术对单分子DNA进行分离和标记片段成像分析,采集染色体DNA标记片段长度信息,研究基因组结构变异,构建全基因组物理图谱,发现、分析和研究DNA大片段结构变异,辅助基因组组装。 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 1 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 300 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 合同签订后3个月 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " rowspan=" 3" p style=" text-align: left " 中科院北京基因组研究所 /p /td /tr tr td style=" border-width: medium 1pt 1pt border-style: none solid solid border-color: rgb(0, 0, 0) windowtext windowtext padding: 0cm 5.4pt " p style=" text-align: center " 2 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 单细胞基因组分析系统 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 能够配合研究所现有高通量测序平台完成基因组de novo测序组装,单倍型(haplotype)基因组组装,基因组结构变异分析(包括:微扩增,微缺失,染色体易位,染色体倒位,拷贝数变异,基因融合等),SNP单体型分析(phasing SNP)和单细胞基因表达谱分析等。 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 1 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 145 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 合同签订后3个月 /p /td /tr tr td style=" border-width: medium 1pt 1pt border-style: none solid solid border-color: rgb(0, 0, 0) windowtext windowtext padding: 0cm 5.4pt " p style=" text-align: center " 3 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 精准基因组医学单细胞分选系统 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: left line-height: 115% " 用于细胞多色荧光参数流式快速分析及分选,满足弱荧光表达检测、稀有细胞检测和高通量单细胞克隆分选。 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 1 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center line-height: 150% " 220 /p /td td style=" border-width: medium 1pt 1pt medium border-style: none solid solid none border-color: rgb(0, 0, 0) windowtext windowtext rgb(0, 0, 0) padding: 0cm 5.4pt " p style=" text-align: center " 合同签订后3个月 /p /td /tr /tbody /table p br/ /p p   二、投标人的资格要求: /p p   1) 符合《中华人民共和国政府采购法》第二十二条要求 2) 法定代表人为同一个人的两个及两个以上法人,母公司、全资子公司及其控股公司(50%以上),只能有一家投标人参与投标 3) 投标人应提供自身的资质、资格文件。与其相关的集团公司、母公司、子公司等的资质、资格文件不予考虑。4) 投标人必须购买招标文件并登记备案,否则无资格参加本次投标。5) 本项目不接受联合体投标。6) 符合技术标书中的相应资质要求 代理商投标必须有原厂授权。7) 投标人不得为列入失信被执行人、重大税收违法案件当事人名单、政府采购严重违法失信行为记录名单的供应商。 /p p   三、招标文件的发售时间及地点等: /p p   预算金额:665.0 万元(人民币) /p p   时间:2017年06月16日 09:00 至 2017年06月22日 17:00(双休日及法定节假日除外) /p p   地点:1) 可从 2017年6月16日至22日(5个工作日 节假日除外),可登陆网址(http://www.o-science.com 招标在线频道 频道服务电话68729910),完成投标人注册手续(免费),然后登录系统浏览该项目下产品的“技术指标”,已注册的投标人无需重新注册。操作中如有问题,可打咨询电话: 010-68729910。招标文件售价:每包人民币600 元。如决定购买招标文件,请完成标书款缴费及标书下载手续,并与招标机构进行确认。售后不退。 /p p   招标文件售价:¥600.0 元,本公告包含的招标文件售价总和 /p p   招标文件获取方式:1) 可从 2017年6月16日至22日(5个工作日 节假日除外),可登陆网址(http://www.o-science.com 招标在线频道 频道服务电话68729910),完成投标人注册手续(免费),然后登录系统浏览该项目下产品的“技术指标”,已注册的投标人无需重新注册。操作中如有问题,可打咨询电话: 010-68729910。招标文件售价:每包人民币600 元。如决定购买招标文件,请完成标书款缴费及标书下载手续,并与招标机构进行确认。售后不退。 /p p   四、投标截止时间:2017年07月05日 09:30 /p p   五、开标时间:2017年07月05日 09:30 /p p   六、开标地点: /p p   在中国科学院北京基因组研究所 1104 会议室(地址:北京市朝阳区北辰西路一号院,中国科学院奥运科技园区104楼)公开开标 /p p   七、其它补充事宜 /p p   本项目允许采购进口产品。 /p p   招标机构名称:东方国际招标有限责任公司 /p p   地  址:北京市海淀区阜成路67号银都大厦15层 邮  编:100142 /p p   电  话: 010-68725599-8440 传  真:010-68458922 /p p   电子信箱:wangjun@osic.com.cn 联 系 人:王军 /p p   人民币支付银行: /p p   开户名(全称):东方国际招标有限责任公司 /p p   开户银行:招商银行北京西三环支行 /p p   帐号:862081657710001 /p p   采购人名称:中国科学院北京基因组研究所 /p p   地  址:北京市朝阳区北辰西路1号 邮编:100101 /p p   电  话:010-84097417 /p p   备注:鼓励以电汇方式购买招标文件、递交投标保证金和支付中标服务费: /p p   须在电汇凭据附言栏中写明招标编号及用途。(请注明招标编号) /p p   以电汇方式购买招标文件的,还需注明项目名称、供应商名称、联系人及联系方式、邮寄地址等相关信息(传真010-68458922)。 /p p   投标保证金只能采用电汇或银行保函支付。 /p p   a)信用信息查询渠道:“信用中国”网站(www.creditchina.gov.cn)、中国政府采购网(www.ccgp.gov.cn)等。 /p p   b)信用信息查询截止时点:同投标截止期,即查询投标人截止到投标截止期的信用信息记录。 /p p   c)信用信息查询记录和证据留存的具体方式:信用信息查询记录将以网站截图打印稿形式与其他采购文件一并保存。 /p p   d)信用信息的使用规则:如投标人为“信用中国”网站(www.creditchina.gov.cn)中列入失信被执行人或重大税收违法案件当事人名单的供应商,或为中国政府采购网(www.ccgp.gov.cn)政府采购严重违法失信行为记录名单中被财政部门禁止参加政府采购活动的供应商,则其投标将被拒绝。 /p p   八、采购项目需要落实的政府采购政策: /p p   中华人民共和国政府采购法 /p
  • 华大基因OpGen联手合作 探寻“完美”全基因组序列
    近日,深圳华大基因研究院(BGI)与基因组光学图谱技术的独家供应机构OpGen公司共同宣布,双方将致力于推广基因组光学图谱技术在人类和动植物全基因组测序组装中的应用。   华大基因和OpGen公司已经成功地合作完成了对人类基因组现有的序列中&ldquo 漏洞&rdquo 的填补工作。双方的研发团队将继续合作完成更多人类及动物全基因组序列。   随着DNA测序技术的发展,研究人员可以花费更低的成本得到更多有效的数据,但是,测序获得的基因组中仍然有许多无法定位和无法鉴别的基因序列存在。OpGen公司的光学图谱技术与新一代测序技术相结合将有助于高效、精确地将组装的基因组序列定位到染色体上,获得高质量的全基因组序列图谱。   华大基因拥有一流的测序能力和强大的计算能力,每年可完成千万个基因组序列。在全基因组测序组装技术的基础上,配合基因组光学图谱技术,该合作项目将会为全基因组测序及基因组学研究的飞速发展提供一个卓越的平台。   OpGen公司开发的基因组光学图谱技术,不依赖序列信息,可以快速生成基于单个DNA分子的高分辨率、有序、全基因组的限制性内切酶酶切图谱。该技术已经被广泛应用于微生物基因组学研究,如比较基因组学研究,菌株分类,全基因组序列组装等。   华大基因研发部门的副总裁徐讯说:&ldquo 通过基因组光学图谱技术与新一代测序技术相结合,我们可以获得更多高质量的具有代表性的参考基因组序列。这将有助于对不同的人群进行更加精确且有针对性的基因组学研究。此外,这两种技术的结合可以改进微生物基因组序列组装结果,在人类元基因组研究领域有巨大潜力,将会极大地促进人类疾病研究的发展和应用。&rdquo   OpGen公司的执行总裁道格· 怀特(Doug White)说:&ldquo 我们很高兴能够与华大基因一起合作,实现基因组光学图谱技术在微生物研究以外领域的应用。我们相信,基因组光学图谱技术与新一代测序技术相结合将为完成复杂的大基因组的全基因组序列带来很大的帮助,能够有效的降低这些基因组学项目的总体研究经费和时间。&rdquo
  • 新方法显著改善宏基因组测序
    在一项新的研究中,来自俄罗斯圣彼得堡国立大学的研究人员开发出一种方法极大地改善人们对实验室中不能培养的有机体---如生活在人胃肠道中的微生物,或者生活在海洋深处的细菌---的DNA进行测序的能力。相关研究结果于2016年2月1日在线发表在Nature Methods期刊上,论文标题为“TruSPAdes: barcode assembly of TruSeq synthetic long reads”。  这种被称作TruSPADES的方法通过计算机将来自Illumina公司的机器产生的长300个碱基对的短测序片段(short reads)组装成所谓的合成长测序片段(synthetic long reads),这些合成长测序片段是基因组中长大约10,000个碱基对的片段。  研究人员说,使用这些合成长测序片段而不是短测序片段组装基因组就好比是使用整个章节而不是单个句子来组装一本书。因此,人们有强烈的动机利用长测序片段改进测序。  论文作者Pavel Pevzner教授说,“这是下一代测序技术。它将对宏基因组测序的操作应用产生深刻影响。”  当前,作为长测序片段测序市场的佼佼者,Pacific Biosciences公司和Oxford Nanopore公司产生的长测序片段是不准确的,而且很难用于解决复杂的测序问题,如组装宏基因组(metagenome),其中宏基因组可以指的是从自然环境取样的全部微生物的基因组,也可以指的是从自然环境取样的全部微生物。相比之下,这种合成长测序片段的准确性提高了100倍,而且能够大规模地快速产生从而覆盖宏基因组中的大部分细菌。  为了开发这种新的方法,研究人员获取携带条形码的长100~300个碱基对的短测序片段。他们然后利用一种在短测序片段测序(short read sequencing)中经常使用的被称作德布鲁因图(de Brujin graph)的方法描绘这些短测序片段,将它们组装成合成长测序片段。这种德布鲁因图允许研究人员确定哪些短测序片段连接在一起,从而组装出更长更准确的合成长测序片段。  接下来就是应用这种方法研究包括从人微生物组到海洋微生物组在内的多种微生物群落。Pevzner和另一名论文作者Anton Bankevich正在与来自美国克雷格文特尔研究所(J. Craig Venter Institute)的研究员Christopher Dupont合作开展这方面的研究工作。  宏基因组学特别充满挑战,这是因为研究人员需要研究生活在一个微生物群落中的好几百种细菌,而不能研究其中的单个细菌菌种。当研究人员从这种微生物群落中提取样品并进行测序时,他们获得的是来自这个群落中所有细菌基因组的片段。这非常像是试图拼出好几百个拼图,但是并不知道哪些拼板属于哪个拼图。TruSPADES方法和合成长测序片段将有助研究人员拼出这些拼图。  Dupont 说,“这种方法以更小的成本产生更好的结果。我们如今正在组装我们之前甚至还不知道它们存在的有机体的基因组。”
  • 华大基因加盟“万种脊椎动物基因组计划”
    深圳华大基因研究院与&ldquo 万种脊椎动物基因组计划&rdquo 联盟(G10KCOS)的科学家联合宣布启动万种脊椎动物基因组一期计划。该计划将依托华大基因先进的新一代测序技术平台、前沿的信息分析和数据处理能力,在未来两年内完成对101种脊椎动物的全基因组测序,解析其遗传密码。   &ldquo 万种脊椎动物基因组计划&rdquo 拟绘制万种脊椎动物基因组图谱,建立哺乳类、鸟类、爬行类、两栖类和鱼类等10000种脊椎动物的遗传信息数据库,研究生物多样性和动物进化的机制,为生命科学和全球动物保护提供前所未有的基础资源。该计划现有来自全球的43个研究机构和68位科学家参与其中。   据介绍,全球已公布的正在测序的脊椎动物物种已达120种。华大基因与G10KCOS的各物种的研究委员会(哺乳类、鸟类、爬行类、两栖类和鱼类)选择并启动了101种新物种的测序工作。筛选这些物种所依据的重要因素包括物种的特殊进化地位及其系统发育的多样性、是否具有与人类有密切相关的生物学特性、该物种研究团队的综合实力和是否可以得到高质量样品等。华大基因将采用新一代高通量测序技术对这101种脊椎动物进行测序,并构建不同物种间的系统进化树。   华大基因与G10KCOS将共同致力于构建高质量的基因组图谱,提供便于数据浏览的信息平台并促进与基因组学相关各物种的研究。完成对全球221种脊椎动物的全基因组测序将成为向破译1万种脊椎动物基因组宏伟目标迈出的第一步,该项目列表中的物种也将随着收集到的新物种材料及获得的资金支持而不断更新。科学家们将对计划列表中新物种的全基因组序列进行高效的组装、注释和分析,并于全基因组序列完成后的18个月内在线公布相关数据。华大基因与G10KCOS欢迎全球更多的科学家加入,启动更多有价值的新物种的全基因组测序工作,一起实现这个伟大的计划。
  • 基因组测序公司CG工作全靠机器人
    CG公司的基因组测序工作完全由机器人完成 工作人员正在蓝色幽暗的&ldquo 车间&rdquo 内操作检测设备   美国加州的山景城是&ldquo 硅谷&rdquo 的重要组成部分。现在,一个与硅芯片相关的潜力大产业正在这里兴起,那就是基因组测序技术产业。这个产业的发展是随着多家大公司的激烈竞争开始的。不过,一家名为&ldquo 整合基因&rdquo (Complete Genomics,CG)的公司不像别的公司一样研发和销售测序仪器,而是为科学家提供外包的测序服务,更绝的是,在这家公司里做测序的,并不是研究人员,而是一排排的机器人。近日,《新科学家》杂志探秘了这家充满科幻意味的公司。   前台都是&ldquo 机器人&rdquo   走进CG公司,连前台都由计算机终端出任。它会主动向来客问好,询问姓名、身份和来访意图。旁边连接的一台打印机则自动打出访客挂牌。与此同时,一份电子邮件已经发送到内部接应人员的电脑上。   这家公司的生产线更像科幻电影里的实验室,昏暗蓝色的房间里到处都是高级仪器,室内温度保持在28℃和相对较高的湿度,几名穿着实验服,带着发罩的工作人员在监视着电脑屏幕,查看着机器人的运作状态。   这儿已经成为了世界上最大的人类基因组测序工厂。只是在这里工作的不是人类,而是机器人。在一个大约只有半个网球场大的房间里,&ldquo 坐着&rdquo 16台机器人,不间断地进行着人类基因组测序的工作。去年,它们完成800个人的DNA测序工作&mdash &mdash 其中三分之一是后半年做出来的。到了今年,它们已经可以每个月生产出400个人的基因了。   CG公司只是目前迅速形成产业的诸多基因组测序公司中的一家,但是它十分独特。公司市场总监图柯特(Jennifer Turcotte)对《新科学家》杂志解释说,通常而言,DNA测序是在一个密封的机器里进行的,但在这家公司的实验室里,机器人却是在一个开放暴露的环境下做基因组测序,这是为了便于维修。实验室特定的温度和湿度是为了符合测序中出现的生化反应,微弱的蓝光是为了避免荧光探测剂在探测基因代码符号时受到其他频率光波的破坏。   这儿所进行的基因组测序,已是目前最新的第三代基因组测序技术,称为&ldquo DNA纳米球测序技术&rdquo 。这种新方法是将DNA链放置在一小块硅芯片上进行调节,自我组装成所谓的&ldquo 纳米球&rdquo 。这样的测序所需要的试剂更少,得到的数据则更多。   技术人员都穿着无尘室服装,因为任何一点灰尘都会干扰测序,除非哪儿出问题了,一般而言这些技术人员不会干预机器人的工作。机器人则会自动添加试剂,操作样本,每个DNA纳米球上携带着70个核苷酸,其排列顺序会通过光信号被拍摄记录下来。   费用正在逐步降低   这些机器人正在做的工作,是一个浩大庞杂的工程蓝图中的第一步,所有的人类基因组中有着30亿对碱基对,而CG计划将其全部组装出来。这需要非常大的计算量,公司为此也建了一个自动数据中心。不过,这个数据中心设在距离公司大约有20分钟车程的地方&mdash &mdash 那儿的电费更便宜。   目前CG公司只针对研究者和制药公司开放,个人还没法购买他们的服务。在这里,每对基因组测序要价9500美元,如果购买1000对以上,则每对价格降为5000美元。这个价格是随着基因组测序技术突飞猛进而急剧下降的,要知道,十年前,第一对人类基因组序列完成时,其价格是以十几亿美元计量的。而科学家现在已经预计几年后,基因组测序的价格可能会降到一般人都可能支付得起的程度。   基因组测序的流水线完全是由机器人来做的,而职员做什么呢?公司共有185名职员,部分是科研人员,忙于改善公司的测序技术,另一部分则是做市场和联络,与各类客户打交道。   基因组测序工程是一项既有非常光明的前途但又异常庞大的科学工程,而自动化则可能成为处理这项工作的最佳工具。基因学家们认为,通过一些基因扫描,是可以找到导致人类易感疾病的一些基因变异,人类基因谱上,有一些常见明显变异,但是就整个遗传问题来看,还有大量的混乱的遗传变异隐藏在DNA双螺旋体中,这些也导致了世界上千奇百怪的遗传疾病。   如何去捕猎这些神秘莫测的错误基因代码呢?只剩下一个方法,那就是将整个人类基因谱测序,来捕捉一些可能和疾病有关的基因变异。这个方法虽然听上去如同&ldquo 大海捞针&rdquo 一样不靠谱,但目前一些迹象表明,今后或许基因组序列会成为医疗记录的一部分,或者科学家可以通过家庭的基因组测序来纠正基因错误。比如,去年西雅图系统生物学研究所的胡德(Leroy Hood)及其小组与CG公司进行了合作,在《科学》杂志上刊登了一篇论文。他们对一家四口的基因组进行了测序。这是个特殊的家庭,两个孩子都患有两种隐性遗传病&mdash &mdash &mdash 米勒综合征和纤毛运动障碍,而父母则完全正常,在分别测出这家人的基因序列后,研究者将父母和子女基因组序列进行比较,验证了米勒综合征这种非常罕见遗传病的致病突变。   提供测序外包的服务   目前,站在基因组测序产业化起跑线上的企业包括了同样位于加州的生物科学公司Pacific Bio。这个公司创立了首次可以对单个DNA进行测序的仪器。和CG公司一样,目前,这家公司也只向研究者提供服务。   还有一些大型的、从事基因组测序产业的公司已经将基因组测序做到医院和个人普及的地步了,如研发制造大型测序分析仪器的Illumina公司。这个公司在2008年美国成长最快的科技公司评选中,风头甚至盖过了Google。它们提供的产品甚至可以直接给病人使用。而另一位基因创业企业家罗斯伯格(Jonathan Rothberg)甚至发明了可以放在桌子上的基因解码器,可以在2小时之内以很高的精度解读出1000万个基因代码符号。   大部分的基因组测序企业都站在一个竞争线上,尽力提高DNA测序的速度,降低费用。而CG公司其实并非和它们是严格意义上的竞争对手&mdash &mdash &mdash 他们计划组装出所有的人类基因序列,研发也是为此目的而进行。此外,他们并不如其他公司一样开发更高级更小巧的基因组测序仪,而是为科学家提供基因组测序的外包服务,也就是说,研究人员无需购买、安装、培训、运行和维修仪器,而只要将样品交给这家公司,等待结果到来就可以。虽然很多人不理解他们的做法,但这家公司始终坚持自己的观点,认为这样的服务最能让科学家将时间从捣腾仪器设备的工作中解放出来,专心放在生物学和假说验证上。   从这几年CG公司取得的成绩来看,这种做法确实是有效的。2009年,CG公司宣布其测出了第一个人类基因序列,并移交给美国生物科技信息中心数据库。同一年,他们在《科学》上刊文,发布了三个完整人类基因组序列分析的结果,当时文章还宣布,测序的成本已经可以降到1726美元。这在生物界引起了轰动。到了那一年结束,他们已经做出了50个人的基因序列。   此外,他们的名字也随着来自各地的科学家一起多次登上了权威学术杂志。除了去年帮助科学家解开了米勒综合征突变难题给科学界留下难忘的印象之外,美国的罗氏公司还曾经借助CG的基因组测序技术,完成了人类科学史上第一例肺癌患者的全基因组比较。相关研究结果刊登在《自然》杂志上。而美国癌症学会也开始和CG公司联手,希望通过其服务比较正常人和癌细胞基因组序列的差异。或许在不久的将来,解开癌症之谜的第一个贡献就属于这些蓝光照耀下的机器人。
  • 首个毒蛙基因组被成功解析
    p style=" text-indent: 2em text-align: justify " 近日,中国科学院昆明动物研究所联合美国北卡莱罗纳大学、加利福尼亚大学和丹麦哥本哈根大学的研究人员成功“破译”草莓箭毒蛙(Oophaga pumilio)基因组,揭示了其基因组演化特征。该成果发表在国际期刊Molecular Biology AND Evolution上。美国加利福尼亚大学教授Rasmus Nielsen、昆明动物所研究员张国捷和美国匹兹堡大学教授Corinne L. Richards-Zawacki为文章的共同通讯作者。团队成员周龙和美国北卡莱罗纳大学博士Rebekah L. Rogers为文章的共同第一作者。 /p p style=" text-indent: 2em text-align: justify " 箭毒蛙是生活在中美洲及南美洲加勒比海沿岸的低地森林中的一种小型陆地蛙,当地部族将它们分泌的毒素涂在箭上,故得此名。强烈的毒性、绚丽斑斓的色彩以及独特的生活习性使得箭毒蛙不同寻常。一些箭毒蛙身上所携带的毒素,其强度是吗啡的200倍。虽然毒素是对付天敌的致命武器,但毒素对箭毒蛙本身却没有影响。箭毒蛙是如何从食物中获得毒素,箭毒蛙的神经系统又是如何演化出抗毒能力,目前还不清楚。 /p p style=" text-indent: 2em text-align: justify " 研究人员对草莓箭毒蛙进行了基因组测序和组装分析,发现草莓箭毒蛙的基因组的大部分区域是由高度重复序列组成的。进一步的比较基因组学研究发现,草莓箭毒蛙的重复元件在鱼和蛙类之间存在着大量的水平转移(Horizontal Transfer,HT)。这些水平转移元件表现出很高的重复性以及很高的转录表达水平,表明水平转移过后这些元件的扩增还在继续。 /p p style=" text-indent: 2em text-align: justify " 草莓箭毒蛙的基因组大小为6.76–9Gb,相比于四足动物要大很多。研究表明这些两栖动物基因组之所以很大,某种程度上可以解释为其基因组的变化是一个转座子(Transposable Elements,TE)不断入侵的过程,并且这些转座子尚未在生殖系中被抑制。转座子的不断扩增导致其基因组逐渐增大。 /p p style=" text-indent: 2em text-align: justify " 此外,研究人员还发现在草莓箭毒蛙SCNA基因家族发生了核苷酸替换,已有研究表明基因SCNA参与了神经毒性生物碱毒素的毒性抵抗作用。其中氨基酸替换M777L在5个SCNA旁系同源基因中同时发生了替换,结果表明这些氨基酸替换在抵抗神经毒性生物碱的毒性中可能发挥着潜在的作用。研究人员还发现了第一个基因组测序毒蛙中的离子通道,并讨论了其与皮肤对隔离毒素的自耐受演化关系。 /p
  • 迄今最全面人类基因组测序完成,比原图增加2亿碱基对和2000多个基因
    最新测序的完整的人类基因组图谱。图片来源:英国《新科学家》网站20年前,科学家宣布读取了一个人的全部脱氧核糖核酸(DNA),其实,他们漏掉了少许。现在,由于读取DNA方法的改进,科学家终于可以从头到尾读取人类的全部基因组了!据生物预印本网站(biorxiv)近日报道,美国科学家对全部人类基因组30.55亿个碱基对进行了测序,与此前结果相比,新结果增加了2亿个碱基对以及2000多个基因。人类拥有数万个基因,它们储存于DNA分子中,基因信息以4种碱基(C、G、T和A)的形式存在,两个碱基相互配对形成碱基对。科学家于1990年启动了人类基因组测序项目,并于2001年公布了首个人类基因组草图。但当时不得不将基因组分成小段读取,然后重新组装在一起,而这样无法将一些高度重复的片段放回原位。随后遗传学家继续改进,但重点还是放在提高现有序列的精确度,而非增加新序列,仍有约8%的序列缺失或错误。新版本基因组由“端粒到端粒”(T2T)联盟绘制。该联盟由加州大学圣克鲁斯分校的卡伦米加和国家人类基因组研究所的亚当菲利皮领导。研究人员选择从一个被称为CHM13的细胞系中读取DNA。该细胞系来自水泡状胎块——一种妊娠失败情况,可以在实验室中培养这种细胞。菲利皮说:“CHM13的独特之处在于,它不是任何人的基因组。”普通人类细胞的每段DNA都有两个副本,往往存在重大差异,一个来自母亲,另一个来自父亲,这使得对DNA精确测序变得更加困难,因为要搞清楚什么是测序过程中的失误、什么是真正的差异非常棘手。使用CHM13避免了这个问题,因为两个副本几乎完全相同。为组装基因组序列,研究团队利用了两种技术:一种是能读取非常长(超过100万个碱基对)片段的测序技术;另一种是精确度极高、能处理差别极小的片段(比如同一个基因的多个副本)的技术。2020年7月,该团队公布了完整的决定性别的人类X染色体。现在,他们公布了完整的人类基因组,新版本比上一个版本增加了近2亿个碱基对以及2226个新基因,是自人类参考基因组首次发布以来进行的最大改进。
  • 如何选择新冠病毒基因组测序的方法和策略?
    高通量测序之于病毒基因组,在检测和研究中的意义和价值已得到广泛验证。但在开展具体的高通量测序工作时,可能会面临很多实际的操作问题,譬如:方法上选择宏基因组测序还是靶向测序?测序策略上选择多少数据量、何种读长?哪些测序平台的通量和数据量更能满足实验室检测要求?以新冠病毒为例,本文对高通量测序在检测和研究中可能面临的问题与选择进行一一剖析。图1 在检测和研究中可能面临的问题与选择测序目的:快速检测or序列组装?高通量测序技术应用于新型冠状病毒的检测和研究,可以实现快速检测以及病毒序列组装。测序目的不同,需要选择合适的方法和策略:如需对qPCR检测呈阴性的疑似病例进行确诊,或对复合性感染、继发性感染等进行鉴别诊断,或对大量待测样本进行大规模筛查,可以利用高通量测序技术进行快速检测;如果需要实现病毒序列组装,以进行未知病原的检测、分析和研究,可以利用高通量测序技术进行更高深度更高覆盖度的测序,获得完整的病毒基因组序列。测序方法:宏基因组测序or靶向测序?对病毒基因组进行高通量测序,可以采取宏基因组测序或靶向测序(包括探针捕获测序和多重PCR扩增子测序)。不同的方法各有优势,可根据实际应用进行选择。图2 不同高通量测序方法的比较可供参考的建议如下:1. 对未知病原的发现及确认,首选宏基因组测序;2. 如需检测或研究样本中所有可能感染的微生物,比如诊断不明原因感染、混合感染、继发感染等,可以选择宏基因组测序;3. 如只需针对目的病毒进行检测,希望以较少的数据量获得目的病毒全长序列,可以选择靶向测序。测序数据量关于测序数据量,需结合具体的测序目的、测序方法、样本病毒载量等因素进行综合评估。通常,提高测序数据量,可以提高检测灵敏度,改善临床检测的阳性率。另外,提高测序数据量,可以提高数据覆盖度,病毒序列组装效果更好。以满足病毒基因组覆盖度95%,且单碱基深度10x为条件:如采用宏基因组测序,可根据使用的研究材料(即待检样本)的情况,选择测序数据量。病毒载量在104 copies/ml以上或qPCR定量CT值qPCR定量CT值在24.5~28.7范围的样本,推荐数据量为100Gb(PE100,500M reads)。对于病毒载量极低的样本(CT值>28.7),不建议使用宏基因组测序,可以采用多重PCR扩增子测序。如采用多重PCR扩增子测序,推荐数据量为5-20M。该方法也适用于病毒载量极低(<102copies/ml)的极端样本检测。注:推荐样本数据量仅供参考图3 基于测序方法及样本病毒载量的测序数据量选择测序读长如进行快速检测,可采用单端测序,推荐SE50/SE100读长,快速、经济;如需要进行病毒全长序列组装,建议使用双端测序,推荐PE100/PE150读长,测序数据质量高、Reads比对更好。图4 测序读长选择测序文库的处理针对病毒RNA测序,在文库制备过程中是否去除核糖体RNA(rRNA)也是一个值得探讨的问题。rRNA占总RNA的80%以上,去除人类rRNA可以提高有效数据利用率。同时也需要考虑样本情况:如果病毒核酸投入量低,以及放置时间久、降解严重的样本,去除rRNA可能会影响建库效果,可以选择不去rRNA,以提高建库成功率。图5 MGIEasy rRNA去除试剂盒测序平台的选择根据实验室样本规模,选择合适的测序平台。每个平台单次运行的样本数与测序方法、测序数据量相关。其中,宏基因组测序方法,一般以单个样本的数据通量100M reads为参考;多重PCR扩增子测序方法,以单个样本的数据通量>5M reads为参考。注1.以单个样本的数据通量100M reads为例;注2.以单个样本的数据通量>5M reads为例。图6 测序平台单次运行的样本数估算小贴士基于DNBSEQ平台的已发表文章目前,已有多篇基于DNBSEQ平台的新冠科研文章在Lancet、nature、Cell等顶级期刊获发。基于DNBSEQ平台的高通量测序技术助力新冠病毒科研攻关,得到了越来越多科研学者的认可。参考文献Multiple approaches for massively parallel sequencing of HCoV-19(SARS-CoV-2) genomes directly from clinical samples.
  • 全球第一套烟草全基因组序列图谱完成
    12月9日,由中国农业科学院烟草研究所参与规划设计与实施的全球第一套烟草全基因组序列图谱&mdash &mdash 绒毛状烟草和林烟草全基因组序列图谱完成,这是继马铃薯和番茄基因组之后,全球完成的第三种茄科植物全基因组序列图谱。   烟草是重要的科研模式植物,绒毛状烟草和林烟草是栽培烟草的两个祖先种。这两个品种的全基因组序列图谱是目前已知植物基因组序列图谱中基因组最大、组装精度最高、组装结果最好的2个图谱。此项工作的完成标志着烟草研究从此全面进入基因组时代。   绒毛状烟草和林烟草全基因组序列图谱测序是中国烟草基因组计划的一部分。中国烟草基因组计划于2010年12月启动,由国家烟草基因研究中心、中国农业科学院烟草研究所等单位承担。目前,重大专项已在多个领域取得突破性进展,烟草突变体库创制已达27万份并正在进行大规模鉴定和分析,烟草分子遗传图谱构建和重要突变基因定位克隆也取得了突破。在此基础上,科研人员将有序开展绒毛状烟草和林烟草的遗传图谱和物理图谱绘制,并启动大量四倍体栽培烟草的基因组测序工作。
  • 世界首个花生基因组序列完成
    4月2日,由多国农作物遗传学家参与的国际花生基因组计划传来喜报:在历经数年研究后,成功完成世界上首个花生全基因组图谱的绘制工作。花生基因组测序的完成和序列的公布将为全球研究人员和植物育种专家培育出更高产、适应性更广的花生新品种提供了 重要的支撑及宝贵的遗传资源。 据了解,中国是国际花生基因组测序计划的重要参与方。此次参与基因组测序的中方合作单位包括华大基因、河南省农业科学院经济作物研究所、中国农业科学院油料作物研究所和山东省农业科学院生物技术研究中心。华大基因参与了全基因组测序、拼接、组装和信息分析工作。 除花生基因组外,华大基因与全球合作方还成功破译了众多其他重要的经济农作物,如水稻、谷子、大豆、高粱、玉米、木豆、小麦、棉花、芝麻等,为育种专家培育优良品种,改良农作物性状,提高农作物产量等提供了重要的遗传资源。
  • “材料基因组计划”已成全球热点
    p   美国、欧盟相继启动“材料基因组计划”,以满足新兴制造业对高性能新材料的需求。专家15日在河北固安举行的迈海材料基因组国际研究院揭牌仪式上表示,“材料基因组计划”已成全球热点,中国版“材料基因组计划”呼之欲出。 br/ /p p   法国巴黎萨克莱大学热能实验室主任兼迈海材料基因组国际研究院首席科学家冯志强说,材料基因组工程是研发新材料的一种先进手段,即从元素周期表中选出元素搭配成新的材料微观结构。法国在材料基因组工程方面拥有深厚的经验和先进技术,他希望中法乃至中欧在这一领域的合作能够推动高端制造业的发展。 /p p   为重塑全球制造业的领导者地位,美国于2011年提出“再工业化”战略,其中一个关键是通过“材料基因组计划”来满足新兴制造业对高性能新材料的需求。该计划目前正在采用人工智能技术加快新材料的开发。美国“材料基因组计划”负责人、美国西北大学教授彼得· 沃里斯曾表示,“这可将需要10到20年的新材料实用化进程缩短一半”。 /p p   冯志强表示,美国、欧盟相继启动“材料基因组计划”,并正利用各种先进技术,因此该领域可谓是交叉学科。中国自己的“材料基因组计划”正快速形成。迈海材料基因组国际研究院将计划采用企业化运作模式,联合美国、俄罗斯和中国等知名高校,搭建国际化的材料基因组研究中心,加速“材料基因组计划”的研发和产业化。 /p p   今年5月,中国国家发展改革委、科技部联合批复同意建设北京怀柔综合性国家科学中心,其中材料基因组等首批五大交叉研究平台已经顺利开工。上海等一些城市也在积极推进材料基因组等领域功能型平台规划布局。 /p p   据迈海材料基因组国际研究院执行院长曾庆丰介绍,“材料基因组计划”是在利用现有数据库平台的基础上,通过数学计算、材料的原理来预测要达到某种材料所需要的组成,然后再通过实验合成,并检测是否符合要求。材料基因组可以反映材料某种特性的基本单元,如原子、分子、电子、离子等物质粒子及其组装机理。 /p p   曾庆丰指出,这种做法把传统的“研发产品”过程翻转过来,即从应用需求出发,倒推符合相应结构功能的材料。 /p p   参与揭牌仪式的专家举例说,有的材料研发理论上可能需要30多万次实验,按照一天做一次实验计算,需要约1000年时间才能完成。而利用“材料基因组计划”的平台和先进技术,可以缩短到几年内获得成果。 /p p   曾庆丰说,迈海材料基因组国际研究院是在华夏幸福、清华产业园、陕西金控等产业资本支持下成立的,预计到2020年形成初具规模的产业链布局,主要包括材料基因组软件、新能源材料、低维材料与器件、石墨烯、生物3D打印和特色专科医院等,将形成超过10亿元人民币规模的材料基因组产业集群。 /p p br/ /p
  • 2010:基因组学推动生命科学大步向前
    2010年下旬,河南安阳曹操墓真伪之辩正酣。而一则来自上海的重磅消息更是引发了多方关注。复旦大学现代人类学教育部重点实验室宣布,向全国征集曹姓男性DNA样本,拟用基因组科学的手段验证出土的头骨是否为曹操本人。   一下子,基因组科学成为热门,这一话题&ldquo 落入寻常百姓家&rdquo 。   事实上,伴随着2000年人类基因组框架图和2003年人类基因组完成图的发表,近十年来,DNA测序技术继续高速发展,基因组科学极大地推动了生命科学的发展,并一直受到各国政府和学术组织高度重视。   2010年,基因组科学研究更是取得了重大进展。在美国《科学》杂志评出的当年十大科学进展中,涉及基因组科学的共有3项&mdash &mdash 尼安德特人基因组、外显子组测序、下一世代的基因组学。这也从一个侧面反映了该项科学在2010年的蓬勃发展。   多个重要物种基因组图谱完成   2010年,期待已久的大豆基因组序列终于测通。   当年1月,来自美国农业部、美国能源部联合基因组研究所等单位的研究人员联合在《自然》宣布,该研究团队利用&ldquo 全基因组鸟枪测序法&rdquo 对大豆基因组的11亿个碱基进行测序,公布了第一张豆科植物完整基因组序列图谱。这也是目前利用全基因组鸟枪测序完成的最大植物基因组。   &ldquo 这是大豆研究一个重要的里程碑。&rdquo 美国能源部大豆生物技术国家中心主任Gary Stacey博士认为。   伴随着该图谱的绘制完成,作为世界上主要油料来源的大豆,其基因组科学研究进展又获新突破。   2010年11月,由香港中文大学、华大基因研究院、农业部基因组重点实验室、农业科学研究院等单位宣布,他们对17株野生大豆和14株栽培大豆进行了全基因组&ldquo 重测序&rdquo ,总共发现了630多万个SNP(单核苷酸多态性位点),建立了高密度的分子标记图谱,并作为封面故事刊登于《自然&mdash 遗传学》杂志。   &ldquo 这是世界上首次大规模获得野生和栽培大豆群体基因组数据。&rdquo 华大基因研究院徐讯博士告诉《科学时报》记者。   精确的大豆基因组序列图谱和其全基因组大规模遗传多态性分析,为大豆遗传性状的鉴定提供了便利,而有关其他物种基因组的研究也不遑多让。   最牵动国人神经的基因组图谱绘制,莫过于国宝大熊猫。   由深圳华大基因研究院、中国科学院昆明动物研究所、中国科学院动物研究所、成都大熊猫繁育研究基地和中国保护大熊猫研究中心等单位共同完成的《大熊猫基因组测序和组装》,于1月21日以封面故事形式在国际权威杂志《自然》上发表,并获评2010年中国十大科技进展。   该项研究表明,大熊猫有21对染色体和2.4亿对碱基,包含基因2万多个,并且其基因组仍然具备很高的杂合率。&ldquo 这同时也标志着基于短序列的基因组测序、拼接和组装技术获得了重大突破。&rdquo 徐讯指出。或许,这项研究进展将让人类更早地知道大熊猫的&ldquo 黑眼圈&rdquo 之谜。   此外,在过去的12个月里,先后有包括中国在内的多国研究人员在《自然》《科学》等杂志上报告完成了苹果、青蒿、黄瓜、寄生性金小蜂、蚂蚁、蚜虫、珍珠鸟等多个重要物种的基因组图谱。   今后,基因组测序规模将越来越大。记者从华大基因研究院获知,仅仅2011年,就可能有土豆、绵羊、牦牛、几种鸟类等多项物种的基因组图谱陆续绘制完成。   基因组科学揭示人类变迁   本文开头提到的&ldquo 利用曹姓DNA鉴定曹操头骨&rdquo 并非国人专利。据英国《每日邮报》报道,比利时学者曾对希特勒家族的39位亲属进行DNA检测,来证明希特勒的族裔。   这些工作的开展,借助的正是&ldquo 基因留有祖先深刻烙印&rdquo 这一事实。   而以基因为研究目的的基因组科学,恰恰使描述人类及动物变迁等地理基因组学和人类学研究成为可能。   2010年,世界各地的科研人员在该方面研究均有较大进展,我国科学家的研究也同样呈现多点开花局面。   2009年12月15日,美国《国家科学院院刊》刊载的中国科学院院士、中科院昆明动物研究所研究员张亚平等人的文章称,通过对680份藏族人群线粒体DNA样本分析表明,现代藏族人的绝大部分母系遗传组分,可能追溯至新石器时期以来迁入青藏高原的中国北方人群。   2010年,来自复旦大学的研究人员也对西藏地区居民进行了&ldquo 基因普查&rdquo 。研究人员推测,西藏居民可能最早来自北亚人群,接近蒙古和贝加尔湖区域等地区的北方人群。而国家计划生育研究所和北京基因组研究所的最新研究结果则进一步揭示,藏族先民可能是经横断山脉向上游迁徙,最后抵达青藏高原。   发现还不止于此。同样是2010年,华大基因研究院对我国藏族、汉族人群常染色体EPAS1基因进行分析,研究结果刊于美国《科学》杂志。这项研究初步推测出该基因在青藏高原世居藏族人和平原汉族人中出现分离的年代。   除了在藏族人类学领域取得了重要成就,科学家在2010年仍大有收获。如果佐以社会学的相关研究,基因组科学或将在人类学研究领域获得更大的空间。   另一项关于古人类的基因组学研究更在2010年震惊世界,并同时位列多个不同机构评选的世界十大科学新闻。   2010年5月6日,多家国际著名机构在《科学》杂志上发文表示,研究人员通过DNA两轮靶向序列捕获的测序新技术,实现了分别对3个古代尼安德特人头骨化石片段DNA的测序。   尼安德特人在进化学上是与我们最为接近的亲族。它们出现在大约40万年前,分布遍及欧洲和西亚,并于3万年前灭绝。   研究表明,所获得的基因组序列图占其整个基因组中的60%之多,而现代人具有约1%~4%尼安德特人的基因。   来自马普研究所的Svante Paabo兴奋地表示:&ldquo 尼安德特人基因组序列首个版本的获得,完成了人类长期以来的一个梦想。我们首次发现了将我们与其他所有生物区别开来的基因特征,包括那些在进化过程中距离我们最近的亲族。&rdquo   中国的发现也同样令人振奋。中国科学院院士、中国农业大学教授李宁等成功提取出距今已有9000年历史的猪骨化石DNA,通过测序研究发现,其是经过驯化的家猪,这将中华民族的家畜驯化史推到万年层面。   或许,在今后的基因组科学研究中,有关人类历史学的观点将不断更新。   下一世代测序技术令人翘首   古DNA的成功测序和组装依赖于测序技术的进步。同样,有别于前两代的下一世代测序技术也在2010年的基因组科学研究中&ldquo 小荷已露尖尖角&rdquo ,并入选世界十大科学进展。   下一世代测序技术,是基于纳米孔的单分子读取技术,可以直接读取序列信息,简便快捷 反观之前的两代技术,则需要荧光或化学发光物质的协助, 通过读取整合到DNA链上的光学信号而间接确定。   虽然该测序方法仍有基因组覆盖不完整等缺陷,但并不影响其风生水起。   例如,斯坦福大学的生物工程师Stephen Quake等研究人员在《自然&mdash 生物技术》发文称,他们利用一台新开发的单分子测序仪,对其本人的基因组进行了测序,仅耗时4个星期,试剂费约48000美元。   与此同时,离子激流公司的下一代硅芯片测序仪也获得突破。利用该技术,科学家们于2010年在《科学》杂志上公布了3个低成本的完整人类基因组序列。   就此,英国纳米孔公司总裁发表评论说,这一技术预示了基因测序领域的跳跃变化,或许今后不超过1000美元就可以完成一个基因组测序。   中科院基因组研究所副所长于军告诉《科学时报》记者,基于现在的经验曲线,即使目前广泛运用的第二代测序技术,也可能在一两年内实现&ldquo 千美元基因组&rdquo 的设想 但是对于&ldquo 百美元基因组&rdquo 的设想可能还有一段路要走,急需革命性技术的出现。   然而,我们已然看到了希望。2010年4月6日,日本大阪大学产业科学研究所的川合知二和谷口正辉宣布,新一代DNA测序技术的可行性首次通过验证。   这篇发表在《自然&mdash 纳米技术》上的文章显示,研究者通过电测方法,利用只有1纳米的超短距离电极,成功地测量出构成DNA的1个核酸碱基分子中流动的电流,成功识别了核苷酸。   令人欣喜的是,科学家们并没有&ldquo 喜新厌旧&rdquo 。&ldquo 不同代的测序技术并不互相排斥,尤其是化学原理不同的基本技术,它们在具体应用方面存在功能上的互补性,将长期共存。&rdquo 于军强调。   在测序技术快速发展的2010年,中国科学家同样不甘落后。   据了解,中科院的基因组研究所及半导体所联合开发、具有部分自主知识产权的第二代测序仪预计在今年3月下线,这不但能打破国外测序仪公司的垄断,还将大大降低我国基因组测序的成本。   此外,中科院基因组研究所已和浪潮集团成立了联合实验室,将共同研发第三代基因测序仪,预计第一台样机于2013年问世。   毫无疑问,新一代的测序技术必将对人类的未来生活产生深远影响。   测序分析理念迎来突破   随着新一代测序技术的广泛使用,测序速度将越来越快,成本则大大降低。但是,测序产生的大量数据却会给后期的生物信息分析带来巨大压力。   &ldquo 我认为生物信息分析是在基因组测定过程中最关键的一项技术。&rdquo 华大基因研究院副院长王俊曾这样表示。   不过,就在2010年,基于基因组的生物信息学分析研究也取得了丰硕成果。   当年10月, 中科院基因组研究所、中科院上海生科院植物生理生态研究所等单位在《自然&mdash 遗传学》杂志发表文章。研究人员结合第二代测序技术和自主开发的基因型分析方法,构建了高密度的水稻单体型图谱,并对籼稻品种的14个重要农艺性状进行全基因组关联分析, 确定了这些农艺性状相关的候选基因位点。   同样来自《自然&mdash 遗传学》等杂志的文章还显示,伦敦帝国理工学院的研究人员也通过多次全基因组关联分析,发现了多个包括糖尿病、冠心病在内的与现代热点疾病相关的基因。   事实上,研究人员还表示,对两个毫不相干的人进行&ldquo 全基因组关联分析&rdquo 对比,或许能够得出许多有用的研究信息,但如果辅以家庭遗传关系,那么测序数据会更加准确。   《科学》杂志在2010年3月发表文章称,美国首次为一个四口之家进行了全基因组测序。由于有家庭遗传背景关联,研究人员更精确地锁定了与米勒综合征相关的4个基因。   &ldquo 家庭测序将成为今后基因研究和疾病治疗方面的一个新工具。&rdquo 于军表示。   随着研究的深入,一项世界最大的表观遗传学研究项目也已启动。据了解,华大基因研究院与伦敦国王学院TwinsUK团队将通力合作,对5000对双胞胎的基因组的化学修饰进行深入研究。   除了对测序结果分析方法及样本选择的拓展,2010年,研究人员还对测序理念和方式进行了全新尝试。   2010年5月,刊于《自然&mdash 遗传学》的一篇杂志文章称,科学家们使用基因组定向捕获工具&mdash &mdash 安捷伦的SOLiD,成功捕获了4个患病婴儿的外显子组并测序成功 而华盛顿大学医学院的研究人员也在《科学》上表示,他们利用外显子测序,找到了一种恶性眼疾的关键基因。   毫无疑问,这项备受各方关注、位列世界十大科学进展的技术将会越来越多地应用于更多疾病研究,用来寻找包括癌症在内的多重疾病的致病基因和易感基因。   于军评论说,与全基因组重测序相比,外显子组测序相对经济、高效。它只需针对外显子区域的DNA即可,覆盖度更深、准确性更高。   而公共数据库提供的大量外显子组数据,更是为科学家更好地解释研究结果提供了便利。   显而易见,在未来,基因组测序分析理念将随着测序技术的升级而不断变革。   各方眼中的基因组科学   正如上文所述,在已经过去的2010年里,全世界每个月几乎都有两到三个家族全基因组和外显子组测序被用于检测疾病的基因突变。   由此可以看出,基因组科学离人们的生活越来越近。英国医学研究临床科学中心的分子遗传学家Tim Aitman表示,基因组测序在未来的10年到20年内将更加普及。   在美国,尽管其食品与药品管理局严格控制私人基因组公司的产品,但随着基因组测序费用的不断降低,越来越多的医生开始利用全基因组或外显子组测序技术进行诊断。   基因组科学带给普通患者治愈疾病的希望,那么对科学研究又会有怎样深远的影响?   《自然》杂志对超过1000名生物学家的一项调查显示,几乎所有生物学家都在一定程度上受到人类基因组计划的影响。   绝大部分人认为自身的研究获益于人类基因组的测序, 其中46%的人认为影响巨大 同时,有接近1/3的人几乎天天都使用到基因组 甚至有69%的受访者表示,是人类基因组计划改变了他们的职业和研究方向。   &ldquo 对于像我这样的年轻研究者,没有基因组,很难想象将如何工作。&rdquo 一位受访者如此表示。   除了能够对生命科学领域的研究快速推进,各国政府都在期待基因组科学的进一步发展。   2008年初,一项被称为&ldquo 千人基因组&rdquo 的计划由来自英国桑格研究所、美国国立人类基因组研究所、中国华大基因研究院等多家机构共同启动。据称,科学家们将对全球至少2000个人类个体的基因组进行测序,从而生成一个庞大的、公开的人类基因变异目录,来寻找基因与人类疾病间的秘密关系。   在2010年,非洲也宣布加入基因组革命。同年,世界各国政府和组织纷纷推出了最新的基因组计划,其中就包括基因地理计划、英国10K计划等。此前,中国对人和水稻基因组研究计划的实施也引起世界瞩目。   &ldquo 近来中科院基因组研究所与沙特王国阿卜杜拉阿齐兹国王科技城合作开展的椰枣相关基因组研究计划,也标志着中国基因组科学在国际上的重要地位。&rdquo 于军非常自豪。   过去的一年,基因组科学的发展一日千里。人们有理由相信,在DNA测序技术飞速发展的引领下,中国和世界基因组科学将走向更加辉煌的未来。
  • 首个完整无间隙人类基因组序列公布
    被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”。当地时间31日,《科学》杂志连发6篇论文报告这一成就。2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。然而由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。新的无间隙版本被称为T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。这些候选基因大多数是失活的,但其中115个仍然可能表达。团队还在人类基因组中发现了大约200万个额外的变异,其中622个出现在与医学相关的基因中。此外,新序列还纠正了GRCh38中的数千个结构错误。具体而言,新序列填补的空白包括人类5条染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。其中包括在重要的染色体结构中及其周围发现的高度重复的DNA序列,如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。新序列还揭示了以前未被发现的节段重复,即在基因组中复制的长DNA片段,已知其在进化和疾病中发挥重要作用。新序列还在识别和解释遗传变异方面具有重要改进,并揭示了关于着丝粒周围区域的前所未见的细节。这一区域内的变异性可能为人类祖先如何进化提供新证据。研究人员称,这一完整的、无间隙的序列对于了解人类基因组变异的全谱和了解某些疾病的遗传贡献至关重要。研究人员表示,下一阶段的研究将对不同人的基因组进行测序,以充分掌握人类基因的多样性、作用以及我们与近亲、其它灵长类动物的关系。【总编辑圈点】基因组的某些区域,其实是一遍又一遍的重复,这些重复区域包括细胞分裂中一些极其关键的部分,也包括可能帮助物种适应的新基因。在过去,所有这些重复使得科学家无法以正确的顺序“组装碎片”——就像高难度的、几乎每一块都相同的拼图,而人们不知道其中哪一块该放在哪,就在基因组图谱上留下了巨大空白。现在的最新成果不再有任何隐藏或未知的部分,或者也可以说,一个全新的基因宝库正在全人类面前徐徐打开。
  • 人的一生,全基因组测序引发的4个需求
    2014年年初Illumina公司推出的HiSeq X Ten 测序平台,实现了&ldquo 人类基因组测序成本降低至1000美元&rdquo 的设想。该测序平台测序成本为当前其他测序平台成本的20%。换句话说,Illunima公司在引领二代测序市场的发展,促使测序成本呈跳水式骤降。    全基因组测序成本随时间变化图(不包含Illumina的最新平台)   在三代测序平台方面,太平洋生物科技公司的 PacBio RS II测序平台能更好的满足多种特殊区域的准确测序与组装。 PacBio 与X-Ten测序平台经常被联合使用,以获取高质量全基因组数据。科研人员和制药公司对高质量大数据的渴望,以及消费者对低成本测序的需求都将得到实现。   如果,测序成本在未来五年内降到几百美元甚至更低,人们的生活或许因此而改变。当低成本测序普及开来,一个人从出生到死亡,对基因组测序将有4个方面的需求。   1、新生儿全基因组筛查的需求   在美国,尽管各个州的基因检测条件略有不同,但新生儿在出院前都会采集外周血进行各种疾病的筛查。因为即便是全球公认的最好的新生儿基因筛查芯片,也只是筛查健康相关的部分基因。全基因组测序将突破当前血液检测的屏障,并扩大新生儿基因检测的实用性。通过新生儿全基因组测序,医生可以监控个体患病风险,并及时进行预防或早期治疗。《Genetics in Medicine》近期发表了一项调查研究,研究人员对514位新生儿父母进行全基因组测序在健康方面的科普,并征询是否期望给自己的孩子做全基因组检测,83%的父母表示愿意。   2、常规测序检查的需求   即便新生儿出院后,测序的需求也不会停止。虽然检测结果显示你没有影响健康的特殊基因,但是环境作为基因表达和沉默的重要决定因素,影响着你的健康。例如营养、压力、特殊化学试剂、机体锻炼等情况,都会对基因表达进行调控。如果基因测序成本足够低,你或许会每隔几年做一次基因检测,或者在生病时,做基因组测序以探寻基因组上是否有改变。与新生儿基因筛查一样,常规的基因组检查可以在疾病早期阶段进行诊断,进而提前做好预防措施。   3、根据测序信息引导购物的需求   相信阅读自己的基因组会是一件很有趣的事情,有些基因检测结果并不一定会影响你的生活,有些检测结果却可能影响你的购物习惯哦。大多数消费者并不知道,日用消费品巨头宝洁公司,将自己定位为基因组学的引导者。宝洁公司通过对引起人类头皮屑的真菌进行测序,以开发更有效的去屑洗发水,应用到旗下海飞丝品牌洗发水。一些公司也被允许利用基因组测序开发适合各个年龄段的护肤品,甚至还有不引起湿疹的高价尿不湿。   4、探索个性化癌症药物的需求   如果你选用个性化护肤品,又怎么会不选择个性化医疗呢?媒体经常报道个性化医疗,高效经济的测序前景将使个性化医疗成为现实,尽管还有很多需要克服的障碍。以癌症为例,医生可以通过测序癌组织样品,确定癌症的原发位置,以及特异突变。根据这些信息进行个性化的治疗。   也许未来的某一天,你的家中可能会拥有一个设备:当你的家庭成员生病了,这个设备可以将他的基因信息和疾病症状发送到疾病控制中心,之后将会收到更好的治疗方案,病人足不出户便可接受治疗。听上去是不是很不可思议?
  • 罗氏454测序参与棉花基因组进化研究工作
    棉花是全球重要的经济作物之一。它的纤维,俗称皮棉,是纺织工业主要的天然原料。全世界棉花种植面积约5亿亩,我国常年种植面积近8千万亩。棉花不但是重要的纤维和油料植物,而且是重要的植物蛋白来源。在食用油中,棉籽油的亚油酸含量最高,达到55.6%。除此以外,棉花种子中还含有极为丰富的蛋白质和脂肪等物质,棉籽榨油后的棉籽粉蛋白质高达45%&mdash 50%,远胜过大米、小麦,甚至超过花生、大豆的蛋白质含量。然而,由于一般栽培棉品种的种子和植株具有色素腺体,而色素腺体中含有的棉酚及其衍生物对人和单胃动物有毒,棉酚是棉属植物特有的化合物,这直接制约了棉籽作为食物资源的开发和利用。 近日,来自8个国家的70多名科学家共同参与的国际合作项目----棉花基因组测序完成。该研究的学术文章《棉花基因组的多倍化及纤维的发育》发表在《自然》杂志上。研究中,科学家们结合传统的Sanger测序与新一代454测序技术对雷蒙德氏棉基因组进行了组装工作,获得了其87.7%的全基因组序列,通过比较基因组以及进化分析发现,雷蒙德氏棉约在1300&mdash 2000万年前经历了一次全基因组复制事件。这次复制事件很可能不是雷蒙德氏棉的第一次基因复制,早在约1亿多年前,雷蒙德氏棉就可能经历了一次基因组复制事件。这些研究结果有利于人类认识古双子叶植物基因组的复制机制。经过雷蒙德氏棉基因组自身比对后,科研人员共鉴定出了2355个共性区域,并发现约有40%的旁系同源基因出现在不止一个共性区域,这表明了雷蒙德氏棉基因组在进化过程中可能经历过大量的染色体重排事件。 自2008年以来,棉花全基因组测序成为棉花基础研究领域的热点问题。下一步要在该成果基础上开发出快捷分子育种工具,实现基因组水平上的棉花分子设计育种,培育出高产、高质、抗病抗旱的棉花优良新品种。分子辅助设计育种和常规育种相结合是未来作物育种研究的必然发展方向,建立在基因组学研究基础上的分子辅助设计育种,因分子标记数量巨大、且不受基因表达时间、显隐性关系和环境条件的影响,大大提高了育种选择的准确性,缩短了育种周期,提高了选择效率。 参考文献:Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres. NatureVolume:492,Pages:423&ndash 427Date published:(20 December 2012)DOI:doi:10.1038/nature11798
  • 中科院等完成橡胶草基因组序列解析
    p   中国科学院遗传与发育生物学研究所李家洋研究组与中国农业科学院、中国热带农业科学院等合作,在橡胶草基因组序列解析方面取得重要进展,标志着以橡胶草作为模式植物进行天然橡胶合成研究进入后基因组时代。研究成果近日在线发表在权威学术期刊《国家科学评论》(National Science Review)杂志上。 /p p   科研人员独立组装完成了高质量的橡胶草基因组草图,该基因组大小为1.29Gb,包含46,000多个基因和约70%重复序列。橡胶草基因组也因此成为目前能够产生高分子量橡胶的植物中,唯一完成基因组测序的草本植物。 /p p   通过产胶植物与非产胶植物之间的比较基因组研究,研究人员鉴定了橡胶草中橡胶合成途径和菊糖合成途径,并阐述了橡胶链延长过程中CPT/CPTL和REF/SRPP两个重要基因家族的进化历程。此外,他们还发现了橡胶草基因组中与自交衰退相关的可能候选区域。该成果并将大大加速橡胶草从野生植物向经济作物的驯化,推动我国天然橡胶产业的发展。 /p p   天然橡胶是与石油、钢铁、煤炭并重的世界四大工业原料之一,2015年全球消耗总量达12.14百万吨,产值约170亿美元。巴西三叶橡胶树一直是天然橡胶的主要来源,但由于种植面积限制、生产成本增加、遗传背景狭窄和病虫害严重等因素,橡胶生产逐渐难以满足需求。我国是天然橡胶消费大国,而巴西三叶橡胶树可种植面积极少,导致我国对外依赖度已超过80%。因此,开发生产天然橡胶的替代资源具有重要的战略意义和经济价值。 /p p   橡胶草又名俄罗斯蒲公英,根部可合成高分子量的天然橡胶和菊糖。由于具有生长范围广,天然橡胶含量高,生长周期较短,相对简单的基因组和遗传转化与基因编辑比较容易等特点,它被认为最有可能成为替代生产天然橡胶的经济作物和科学研究的模式植物。21世纪以来,世界各国相继成立了天然橡胶研究计划,相比之下,我国则研究相对较少。2015年4月中国“蒲公英橡胶产业技术创新战略联盟”正式成立。 /p p /p
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制