电磁阀厂家
免费服务热线

Free service

hotline

010-00000000
电磁阀厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

谷歌推人类基因组云端服务项目

发布时间:2020-03-10 11:05:18 阅读: 来源:电磁阀厂家

A5交易A5任务 SEO诊断淘宝客 站长团购

据国外媒体的报导,谷歌最近正在通过一个名为Google Genomics的项目与医院和大学实验室展开合作,共同推动人类基因组的存储、比较和分析工作。

Google Genomics是谷歌在去年3月推出的一项云端服务,但随后由于没有进行大规模的推行而并未引发人们的注意,该项目皆在帮助大学实验室和医院将患者或科研对象的生物基因贮存到云端上,服务的目标是探讨遗传变异交互,意味着科研专家能够访问数百万的生物基因组数据,并能轻松简单的进行比较和分析。除谷歌以外,人类基因组数据的存储目前还已引发了亚马逊、IBM和微软等科技巨头的注意。

谷歌自Google Genomics项目启动以来,已与多位科学家进行了面谈并专门为此开放了一个API接口,方便这些科学家将DNA数据转移到谷歌的服务器群上,而科学家则可以使用这个包括了数十亿互联网用户和网页索引的数据库进行实验。

生物学家们可以通过我们的服务来从对一个基因组的研究升级到对数百万个基因组进行研究,主管Google Genomics项目研发的软件工程师大卫格雷泽(David Glazer)说道,我们希望通过我们的数据技术来帮助他们实现质的突破。

虽然有些科学家认为谷歌的服务对复杂的基因组数据来讲不过是无济于事,但还是有很多科学家对此进行了肯定,比如斯坦福大学的教授阿图尔巴特(Atul Butte)在今年对谷歌的这1计划进行详细了解以后,就表示这感觉就像是传统旅行社在看到Expedia(全球最大的在线旅游公司)一样。

科学家们目前在使用新型装备在对DNA进行解码时所取得的数据愈来愈多,速度也愈来愈快,如剑桥伯德研究所(Broad Institute in Cambridge)的有关负责人就介绍称,在今年10月的实验中,他们每解码一个人类基因组需要32分钟,所产生的原始数据高达200TB。

虽然这类量级的数据流与大型互联网公司所处理的数据相去甚远(伯德研究所两个月所产生的数据与YouTube上一天的数据上传量相仿),但却远远超过了任何一名生物学家的处理能力。就目前情况而言,此类数据的存储和访问通常通过大型的商业数据中心来实现。美国国家癌症研究所在上月曾表示将耗资1900万美元将大小为2.6PB的癌症基因组图谱数据的副本存储到云端,这些触及数千名癌症患者的数据的副本未来也将会存储到谷歌Google Genomics项目和亚马逊的数据中心。

西雅图系统生物学研究所(Institute for Systems Biology)的科学家希拉雷诺兹(Sheila Reynolds)指出,他们希望创建一个癌症基因组数据云,让科学家们可以像使用传统网络搜索那样简便地分享信息和进行虚拟实验,毕竟并不是每个人都具有处理PB级数据的能力的,她说道。

谷歌和亚马逊已就DNA数据向云端转移的费用进行了为期一年的价格战。谷歌表示每一个基因组的年存储费为25美元,而计算这些数据还需要支付额外的费用。目前一个人类基因组在解码以后的原始数据大小在100GB左右,不过该数据还可以被精简至1GB以下,谷歌对此类数据的云端贮存价为每一年0.25美元。

云存储服务在一定程度上推动了Tute Genomics、Seven Bridges和NextCode Health等初创企业的发展,这些公司均致力于研究能够帮助医院和科学家检索基因数据的浏览器服务。谷歌和亚马逊所提供的是后端服务,他们常常会鼓励我们在他们的云端创建基因组公司,Seven Bridges的首席执行官德尼兹库鲁尔(Deniz Kural)介绍道,该公司目前在亚马逊的云端存储并管理着1600位研究人员所提供的基因组数据。

库鲁尔指出,未来一款药物的研究和运用也将会依赖于在全球DNA互联网上进行数据检索,根据我们的预测,加入我在未来身患肺癌,那末医生就会对我的基因组和肿瘤基因组进行测序,然后将对应的数据与数据库中的5000万组数据进行比较,他说道,结果就是能够在短时间内找到最合适我的药物。

根据谷歌软件工程师格雷泽的介绍,Google Genomics项目旨在推动生物医学研究从作坊式向工业化范围生产发展,目前他本人也在学习遗传基因方面的知识,同时也在听伯德研究所总监埃里克兰德尔(Eric Lander)的《生物学概述》(Introduction to Biology)课程,另外格雷泽也已将自己的基因组测序数据放在了谷歌的云端。

格雷泽并未谈及Google Genomics项目的范围和目前为多少客户提供服务,只是泄漏称目前已有3500组来自公共项目的基因组存储在谷歌的服务器上。同时他还指出该项目与谷歌在近期大力投入的保健类项目(如谷歌在今年启动的研究如何延长人类寿命的Calico项目)暂无关联,与基因组有关的就是人们正在逐步认识到科学技术是能够推动并改变生命科学研究的现状的,格雷泽说道。

负责管理斯坦福大学内最大的遗传数据计算机集群的物理学家索马里达塔(Somalee Datta)表示,由于谷歌和亚马逊的云存储服务在近期都下调了价格,其存储本钱已降至与他们的数据中心运营本钱类似的水平,我们认为云存储价格还是继续下落,1直到比较公道的区间,达塔说道。

达塔还介绍说,目前一些斯坦福的科学家已开始使用谷歌的BigQuery数据库系统(格雷泽的团队已将该系统与基因组数据相兼容),该系统最初是为了跟踪网民活动而开发的,但其一样能够帮助科学家们进行数以千计的大型基因组实验,有时候科学家们会想要做一些比较疯狂的事情,那末就需要一定的数据存储和分析处理能力,达塔说道,而谷歌目前就能够提供这类能力,所以我认为这是一种正确的技术发展方向,也是值得全部科研界为之肯定和鼓励的。

中法网(北京)国际文化传媒有限公司

中国石化销售股份有限公司

重庆华兴玻璃有限公司

重庆刘一手餐饮管理有限公司