今日,药明康德及药明康德下属企业明码生物科技与华为在上海联合发布了精准医学云平台——明码云。
什么是明码云
据介绍,明码云旨在打造覆盖全国、标准统一、安全可靠的精准医学大数据云平台,推动国内基因组信息及精准医学大数据的集中和应用,促进政府相关部门、医疗行业、学术界以及业界在精准医学领域的交流与合作,全面助力中国的精准医学计划。
精准医学作为战略新兴产业今年被正式列入国家“十三五发展规划”。相关权威人士介绍,我国精准医学研究旨在搭建国家层面的大队列、样本库、数据库、知识库,同时为各方搭建研发台阶,实现“从大数据获取到临床诊疗应用的全过程研究”。而伴随精准医学研究项目在全国的全面展开,大规模人群基因组、临床表征等相关数据库正极速积累,这些海量数据的存储、分析和共享将面临巨大挑战。
此次药明康德及明码生物科技与华为联合发布的“明码云”将依托华为在云计算方面的积累及其遍布全国的网络基础设施,结合药明康德在医药研发领域的积淀,以及明码生物科技在分析、挖掘、共享基因组学及精准医学大数据方面积累的经验,共同打造一个云计算、云存储、云分享和交换的全国云服务网络平台。
据悉,明码云将遵照国家食品药品监督管理总局(CFDA)相关规定,通过与第三方生命科学云平台安全供应商合作,共同开发适合中国精准医学计划的数据标准和交换框架。
药明康德的明码生物科技是干什么的?
药明康德子公司明码生物科技是一家基因组信息公司。其平台包括CLIA和CAP认证的基因组学中心,能管理和挖掘更多基因组数据的创新数据库构架和可在线下和云端使用的基因组解读和发现系统等,同时,用户可以通过检索的方式对海量基因组数据进行线上查询和开展合作,目前,该公司在上海、美国马萨诸塞州的坎布里奇和冰岛雷克雅未克设有办事处。
此前3月10日,明码生物科技与纽约Simons基金会共同建立的全球最大自闭症数据库宣布上线。通过WuXi NextCODE Exchange提供的开放式云端数据库,全球研究自闭症的研究者们可以自由访问大量的患者及其家人的基因组信息。
据悉,该数据库(Simons Simplex Collection,SSC)包含近2600个家庭的基因组序列数据和大于2000种表现型数据,所有这些家庭均包含有一个患一种自闭症(autism spectrum disorder, ASD)的儿童、正常的父母和兄弟姐妹。
该数据库的客户端的特征包括:所有SFARIGene和其他主要的ASD基因及其突变列表;所有主要的公开标准数据库;原始BAM测序数据的即时图形化展示;突变类聚以强化罕见突变的统计关联性;新生同源基因检测;携带者分析;预测的基因突变效应和等位基因频率过滤;定义表现型的性状选择器和报告生成器;其他来源数据的输入与功能整合。
通过明码生物科技的一体化clinical discovery tools,SSC用户可以直接查询个人基因组数据、家系数据、或者整个数据库。不需要移动或者下载数据文件,就可以挖掘所有样本的GATK和FreeBayes突变;可以通过由归一化的全球标准序列数据在后台支持的、始终处于运行状态的可视化工具查看运算结果;或者与同行开展合作。
华大联手阿里云的竞争
同样是针对未来精准医学发展过程中存在的数据问题,2016年2月,华大基因宣布其在阿里云计算平台部署的服务产品BGI Online国内beta版本正式上线。该系统集成了高性能计算,大规模存储及安全网络互联等基础设施,支持数据的云端存储、分析、展示和交付。用户可以在BGI Online上访问自己的数据,获取标准分析结果,也可以定制个性化的数据分析方案,并与其他授权用户分享数据和成果。
华大基因研究院院长、首席科学家徐讯表示:“BGI Online将会吸引第三方应用开发者和数据分析服务厂商,将他们的应用整合到公共平台中,最终打造成为类似苹果的APP Store。”
在这个“基因应用市场”中,华大基因的测序仪类似于一部智能手机,用户可以到BGI Online“下载”各种官方或第三方应用,进一步开发自己的数据解读和分析系统。并计划BGI Online在后续版本中引进第三方应用开发者和数据分析服务商。
华大基因研究院副院长、信息技术中心主任方林介绍,除了基于云端的平台,华大基因也在开发整合硬件软件技术的BGI Appliance一体机,通过一体机与BGI Online的互动,将能为用户提供更加丰富的体验。
对于,科研院所、医疗机构及中小型基因行业创业公司而言,只要拥有基因数据,不必自建和维护昂贵而复杂的计算、存储平台。
其实,除了药明康德与华为,华大与阿里云,目前在分子诊断、精准医学和云服务领域探索的公司也都在尝试搭建基础性的基因云服务或涉其中,阿里云计算总裁胡晓明曾表示,2016年视觉革命、生命科学和数据创业三个行业将迎来爆发性增加。2016年将是生命科学产业发生重大变化的一年。基因正在和精准医疗形成交叉,人体正在变得数据化。生命科学领域数据爆炸式的增长,对海量数据的计算、存储和分析提出新的挑战。(生物谷 Bioon.com)