剑桥Broad研究所带来了它的云端基因组分析工具——与亚马逊、Cloudera、谷歌、IBM、英特尔、微软合作。
这个压缩到GATK的工具包,是由哈佛-麻省理工学院开发的高通量测序数据分析软件。自从去年阿尔法(alpha)在谷歌的基因组学基础上推出后,现在已有全世界3.1万注册用户。
Broad与谷歌基因组的合作,使得GATK作为一个SaaS格式(软件即服务),使用户可以达到超越桌面的扩展。
该公司计划开发和推出GATK4,是GATK的新版本。新的服务将包括癌症、结构变异、拷贝数变异以及相关的其他功能。
“改良版的GATK不再只是提高变异的发现和基因分型——而是要消除阻碍项目进展的技术壁垒,”Broad研究所负责人在采访中说道。
另外值得注意的是:Broad工程师正在和英特尔合作开展加速变异的检测方法和生物标志物的发现。
“在云上编排基因组是非常复杂的”,Eric Banks,Broad GATK软件的开发者再一次声明中说道。“我们希望简化常见的基因组数据类型,就像一般的读取和变种,并创造一个允许任何研究人员可以使用的简单有效的方法环境。”
谷歌基因组(Google Genomics)研究主任David Glazer在新闻报告中说,GATK服务已经被证明是成功的。“我们已经通过这种途径为大量的用户运行数千件样品,”他说道“我们还在不断的对这个工具在优化,使其更加符合成本效益。”
回顾:
谷歌VS亚马逊
早在13年的3月谷歌就已经推出了一项云端服务(Google Genomics),但是随后由于没有进行大规模的推出而并没有引起人们的注意。该项目皆在帮助大学实验室和医院将患者或科研对象的生物基因存储到云端上,服务的目标是“探索遗传变异交互”,这也意味着科研专家能够访问数百万的生物基因组数据,并能轻松简单的进行对比和分析。谷歌自Google Genomics项目启动以来,已经与多位科学家进行了面谈并专门为此开放了一个API接口,方便这些科学家将DNA数据转移到谷歌的服务器群上,而科学家则可以使用这个囊括了数十亿互联网用户和网页索引的数据库进行实验。
除了谷歌之外,亚马逊、IBM、微软等科技巨头们也对这块“地盘”密切关注着。
谷歌和亚马逊已经就DNA数据向云端转移的费用进行了为期一年的价格战。谷歌表示每个基因组的年存储费为25美元,而计算这些数据还需要支付额外的费用。目前一个人类基因组在解码之后的原始数据大小在100GB左右,不过该数据还可以被精简至1GB以下,谷歌对此类数据的云端储存价为每年0.25美元。
云存储服务在一定程度上推动了Tute Genomics、Seven Bridges和NextCode Health等初创企业的发展,这些公司均致力于研究能够帮助医院和科学家检索基因数据的“浏览器”服务。“谷歌和亚马逊所提供的是后端服务,他们往往会鼓励我们在他们的云端创建基因组公司,”Seven Bridges的首席执行官德尼兹·库鲁尔(Deniz Kural)介绍道,该公司目前在亚马逊的云端存储并管理着1600位研究人员所提供的基因组数据。
谷歌+Broad研究所
6月24日,谷歌基因组(Google Genomics)宣布与Broad 研究所进行合作,强联手推出基因组分析软件GATK(The Genome Analysis Toolkit)的云端版。
谷歌与博德的合作伙伴关系产生的第一个成果就是将 GATK 带到谷歌云平台。两者合作的核心目标是改进提升基因分析水平,从而在每一个体的基因特征基础上给出更有针对性、更个性化的诊疗方案,帮助治愈一些传统意义上的“绝症”。要达成这一目标,需要庞大数据来分析确认不同的治疗方法对特定基因图谱的影响,这就需要云计算发力。
除了提供计算平台用于分析数据,谷歌还表示 GATK——在两家合作关系之外,这一软件已被许多科学家所使用——会给予研究者信心,他们是“根据最佳实践来处理他们的数据,无需担心IT 基础设施的管理问题。”(生物谷 Bioon.com)