2017年9月9日 讯 /生物谷BIOON/ –近日,一项刊登在国际杂志Proceedings of the National Academy of Sciences上的研究报告中,来自国外的研究人员通过研究,利用全基因组测序和机器学习等技术成功实现了对每个人面部及其它机体特征进行鉴别。
图片来源:Human Longevity, Inc.
研究人员认为,这项研究或为法医提供了新的方法来识别凶手,同时本文研究对于数据保密、识别以及个体的充分知情同意也具有重要的意义。随着越来越多基因组数据的产生以及公共数据库的扩大,我们往往需要进行更多的公众审议。
这项研究中,研究人员对1061名年龄在18-82岁不同种族的人群进行研究,对参与者进行了至少深入为30X的基因组测序,同时研究人员还收集了参与者的一些表型数据,包括3D面部图像、声音样本、眼睛和肤色、年龄、身高及体重等信息。研究人员能够准确预测参与者的眼睛颜色、肤色及型别,但预测其它更复杂的遗传特点似乎比较困难,但他们认为他们所开发的预测模式是合理的,但后期还需要大量的研究对象才能够进行更为精准的预测。
此外,研究人员还开发了一种名为最大熵算法的机器学习算法,这种算法能够在所有的预测模型中帮助寻找最佳的组合来将全基因组测序数据同表型和人口数据进行匹配,来进行更为准确的人群识别,平均而言在不同种族中能达到80%的识别率,在非洲裔美国人和欧洲参与者中能够达到50%的识别率。
研究者Venter表示,我们进行这项研究是为了证明我们机体的基因组能够编码任何制造机体的元件,尽管这是对一个有限的群体进行的概念验证研究,但我们认为随着这项研究以及我们所开发的数据库中参与者数量的增加,我们就能够更加准确地通过个体的基因组及其它信息进行人群的准确识别。
Venter补充道,此外我们都非常关心,目前公众和很多研究团体对于个体在基因组方面的隐私和安全并没有过多的关注,因此这就要求我们进行我们后期应该进行更多深入的分析,并且开发出更多新型的技术解决方案。本文研究阐明了新型成像技术对大规模人群进行特征筛选的潜力,机器学习技术能够进行完全自动化的数据解释,同时在科学研究中也扮演着关键的角色。(生物谷Bioon.com)
原始出处:
Christoph Lippert, Riccardo Sabatini, M. Cyrus Maher, et al. Identification of individuals by trait prediction using whole-genome sequencing data. PNAS (2017) doi: 10.1073/pnas.1711125114