中国民意网 研究报告,调查问卷,民意,新闻,实用资源,心理测验,本单位联系电话见网页底部。
网站公告列表

  没有公告

加入收藏
设为首页
联系站长
您现在的位置: 中国民意网 >> 文章中心 >> 实用资源 >> 文章正文
  [图文]Google 每天处理约 20000000GB 的数据           ★★★ 【字体:
Google 每天处理约 20000000GB 的数据
作者:佚名    文章来源:bbs.chinaz.com    点击数:    更新时间:2008-11-24    
Google 热衷于处理全球的信息,每天,他们花费大量时间探索更好的信息整理技术,他们目前使用的技术为 MapReduce,这是一种可以对数据进行并发处理的软件架构。鉴于其简单性与处理大规模数据的能力,MapReduce 是 Google 日常数据处理的完美技术方案。



Google 的数据整理实验一直以每 TB 数据表现为基准。这些标准话实验帮助 Google 理解和对比不同技术的优秀劣,并获得经验和教训,以改进下一代数据处理技术。

目前,Google 的每 TB 数据处理能力为,在1000台计算机中处理 1TB 数据的时间为68秒(使用 Google File System 将 1TB 数据保存在100亿个 100 字节的非压缩文本文件中),以前的表现为 910 台电脑 209秒

但 Google 要处理的数据远超过 TB 级,因此,Google 做了 PB 级数据处理实验。1PB 数据是 1TB 的1000倍,或者,形象一点说,1PB 数据相当于 2008 年5月,美国国会图书馆存档的 Web 数据的 12 倍。2008年1月的统计结果显示,Google 每天处理的数据为平均为 20PB,相当于 20000TB。在 4000 台计算机中处理 1PB 数据花费6小时领2分钟。

有一个有趣的问题,就是,如何保存这么多数据。Google 将这些数据保存在 48000 个硬盘中(每个只利用了部分空间),每次进行数据整理,至少有一个硬盘坏掉(鉴于处理的时长,硬盘的数目和硬盘本身的寿命,这并不奇怪),因此,为了保证数据安全,Google 将每份数据都在不同的硬盘上写三份。

1TB=1000MB

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关文章
    前代理商再揭黑幕:百度做过不
    央视曝光百度 转眼竟成谷歌
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)

    京ICP备05009718号
    地 址:北京宣武门西大街28号7号门7层 邮 编:100053 电 话:010-63601017/18/19 63601024
    站长:爱祖国爱人民