6月15日,在欧洲人类遗传学大会(ESHG 2019)上,全球领先的生命科学前沿机构华大集团(以下简称“华大”)发布了“高清”组装基因组解决方案及标准,该方案及标准基于华大旗下子公司华大智造自主测序技术DNBSEQTM和stLFR,开启了基因组测序“全高清”时代,对更全面和准确地获取遗传信息有着里程碑式的突破。
在大会现场,华大智造首席科学家Rade Drmanac博士向在场嘉宾阐述了华大定义“高清”基因组的“676”标准,如果说过去短读长测序比对参考基因组,绘制出的是一幅打着“马赛克”的“肖像画”,那么基于“676”标准的从头组装二倍体基因组数据,则将基因组测序真正带入“全高清”时代,将极大推动个性化医疗的发展。
Rade Drmanac博士在现场讲解“676标准”
目前,由于测序技术的局限性,大多数全基因组测序只能获取单倍体数据。但人类基因组是二倍体,即我们从父母亲那里各遗传到一套染色体,这些染色体之间的变异和差异可能对个体的表型产生重要影响。
而新发布的高精度基因组标准和解决方案将有助解决这一问题。此次华大公布的高精度基因组测序数据标准为:Contig N50>106,Scaffold N50>107,组装全基因组数据>6G,简称为“676”标准。
该标准将从头组装两条染色体,获取二倍体测序数据。依托华大更准确和低成本的个人全基因组测序解决方案, “676”标准可以为人们提供自己独立的参考基因组数据。基于这些数据,可以检测所有类型的结构变异,且无需与参考基因组进行比对,将大大提高了基因组数据的参考性,最终帮助个体进行复杂疾病的诊断和预测,并可作为衡量个体一生健康变化的基线。
发布这一标准的Rade Drmanac博士对此表示,“676”标准可单独组装每个人的基因组,并且不依赖于参考基因组,能提供更加全面和准确的遗传信息,将有助于推动个性化医疗的实现。
华大智造的stLFR(单管长片段)技术是实现“676”标准的核心,基于专有的DNA分子共标签技术,通过将来源于同一DNA长片段的短读长测序片段标记上相同分子标签,stLFR能够基于高精度短读长测序获取长片段的DNA信息,而与DNBSEQTM测序技术相结合,stLFR技术还能够实现高质量变异检测,二倍体基因组定相,结构变异解析及其他长读长应用。
除了技术优势,“676”标准及其解决方案在测序成本上也同样具有优势。在即将上市的MGISEQ-T7测序平台上,“676” 标准的全基因组测序成本预计为1000美元。
在本次会议上,华大还计划将“676”标准应用于新开展的基因组项目Diverse Genomes Project,该计划将在未来几年内对1000个样本进行测序,以在不同人群中创建高质量的参考基因组和更为完整的人类基因组多样性数据库。届时,这些数据将免费向研究者开放。目前该项目正公开收集样本,并招募合作者加入。
除发布“676”精准基因组标准和解决方案外,华大还在本次大会上宣布了与生物信息学软件公司Sentieon的合作,Sentieon是基因组装配和变体调用解决方案的领导者,双方将共同开发基于stLFR技术的基因组组装软件,实现低成本高精度的单体型定相基因组从头组装。