8月17日,Nature封面介绍了至今为止世上最大人类基因变异数据库,该基因库凸显出若干误导罕见疾病的基因突变,以及可能对疾病扮演意想不到角色的其他突变。
据报道,2年前由多达100人的研究团队建立了外显子组(exome)超过1000万变异的数据库。研究作者们编制的该数据库,利用来自20多个疾病研究的DNA数据进行分析。ExAC在2014年在网上公布,被查询了超过500万次。
外显子组仅是人类基因组的一小部份,占DNA的不到2%,但具关键重要性。
每个人都有成千上万个变异,而大部分基因变异属良性。但缺乏几近完整的可能DNA序列数据库,科学家或医师很难治疗病患,挑出有害变异,把它们与特定情况连结起来。而外显子组由基因编码部位组成,即DNA的蛋白质表现区,发生错误会引发串联式效应,导致疾病。
《自然》(Nature)期刊刊登的第一个分析这个数据库的研究,证实有很大的潜力可精确标出遗传疾病成因。
研究作者麦克阿瑟(Daniel MacArthur)目前是美国麻省理工学院和哈佛大学的布洛德研究所(Broad Institute)医学和人口遗传学共同负责人,他说:“研究让我们有能力发现罕见的变异,对窥探罕见遗传疾病的根源,提供无可比拟窗口。”
外显子组整合联合(Exome Aggregation Consortium, ExAC)数据库汇集数10个既有研究,试图弥补不足。数据库包含来自6万多人的蛋白质编码细部数据。
在这篇Nature封面研究发表的同一天,NEJM和Nature Genetics都各有一篇研究文章发表,都运用这个数据库纠正了之前对DNA变异和疾病的观点。
NEJM:利用ExAC数据库可避免遗传性误诊
同一天发表在NEJM的一篇文章指出,这种“遗传性误诊”侧重于一种遗传性疾病称为肥厚型心肌病。众所周知,心脏肌肉变厚会影响泵血。
在一个实验室检测了三年的记录中,发现有七名患者被告知他们携带了两种与心脏病有联系的DNA变异。两变种后来被重新分类为良性。其中有5名是非洲裔,如果这些变种的原始研究已经包含了足够美国黑人的样本,他们可能不会得出错误的结论。
科学家介绍新的数据库ExAC,可以避免这样的错误。它提供了一个比过去更全面的DNA变化的集合。来自欧洲,非洲,南亚,东亚和拉丁美洲血统的人大约1000万个微小的变化已被列出。
Nature Genetics:利用ExAC数据库可纠正拷贝数差异(CNV)
在同一天发布在Nature Genetics另一项研究中,在ExAC近6万人的外显子数据中分析了罕见拷贝数差异(CNV)的比例和特性。研究发现就平均而言,个人带有0.81个删除的1.75个重复的基因,大多数人(70%)携带至少一种罕见的基因CNV。
对于每个基因,研究人员凭经验估计了对CNV的相对容忍度,证实了基于单核苷酸变异(SNV)基因限制的检测是和保持进化的分析独立相关的。研究文章指出对于精神分裂症患者,受CNVs影响的基因比对照组更宽容。
ExAC 的CNV数据在人类基因差异谱系中是一个重要的组成部分,有助于个人基因组的揭示和人群疾病的研究。
Nature:利用ExAC数据库,医学更接近真实
在Nature文章中的分析对于运用ExAC如何指出过去的错误提供了另一个例子。研究人员分析了192个之前认为和疾病相关的DNA差异,但在ExAC中显示实际在一般人群中也是非常普遍的。
研究人员发现在新的标准下,至少163例该被重新归类为良性或者可能是良性。在去年11月,研究者报道了126种这样的差异被重新分类。