但在这里需要引起重视的是,大数据和云计算对数据中心场地基础设施的建设的确是有影响的,这种影响更多地体现在宏观规划层面。数据中心场地基础设施的宏观规划最核心的两个重点是“可用性等级”和“容量规模”。首先是按照业务要求确定数据中心需要达到的可用性等级,体现出来的建设指标如 “按照国标A级或按照Uptime Tier III进行建设”,当然,对大规模数据中心可以有不同可用性等级模块的组合方案。而容量规模可分解为电量、面积、制冷量三个指标,对新建数据中心而言,制冷量可以按照IT电量进行配套设计,因而核心指标是电量和面积,电量与面积之比即为功率密度。容量规模体现出来的建设指标如“总IT电量1万KW、功率密度7KW/机柜”等,当然不同模块可以设置不同的功率密度以适应不同的业务需求。
从“可用性等级”和“容量规模”两方面着手,大数据和云计算对数据中心场地基础设施建设的宏观影响大致有如下几个方面:
数据中心单体规模变大,小规模数据中心的数量减少
当前欧美地区新建数据中心也均以大型云计算数据中心为主,以提供新型的IaaS、PaaS等作为发展方向,中国也在跟进这一趋势。截止2010年底,美国大于2,000平米的数据中心已经超过570个,而我国数据中心数量虽然已经接近45万个,但超过2,000平米的数据中心仅有50个左右,不足美国同等规模数据中心的9%。我国数据中心发展水平与欧美尚有差距,而大数据与云计算的应用与深化将是推动我国数据中心发展的一次良机。
数据中心场地基础设施的可用性等级不再片面追高
因为有云计算在软件层的冗余,人们发现在场地基础设施层面片面追逐高等级是不划算的。一个典型的例子是eBay,eBay由原来所有数据中心Tier4级别转变为20%Tier4和80%Tier 2,建设成本和运维成本减半,依然可满足业务发展所需。
单机柜功耗走向高密度
与传统计算相比,大数据与云计算意味着功率密度的升高,这是建立在IT设备标准化基础之上,追求运维成本最低的自然选择。eBay曾经做过评估,在业务量一定时(每天支持的交易量固定),机柜密度越高越省钱,直到28KW/机柜(超过此密度后,空气散热无法满足需求,机柜内部必须采用液体制冷,会导致成本大幅上升)。但中国的现状不同,虽然也在走向高密度,但高的程度却比较温和。
从下表内容可以看出中美数据中心的需求和理念的差异以及所导致的设计差异。虽然时常在媒体上看到国外某些大型数据中心令人心动的超低PUE,但我们必须意识到中外国情不同,国外的方案不能简单地复制到中国。
我们要借鉴欧美数据中心成功的建设经验,并结合我国的国情才是我国政府和企业发展、建设和布局数据中心的最佳途径。经过上述分析,我们提出如下大型数据中心设计的关注点,以满足大数据和云计算时代的需求:
可用性-满足业务对可用性的需求,区分不同业务的不同可用性需求,不片面地追逐更高的可用性等级;
灵活性-能够有效地支持未来业务的需求,通过模块化设计方法,统一规划设计,分步实施。采用设计技术手段,在一定范围内实现可用性等级和功率密度的可变特性;
经济性-以总拥有成本TCO(建设成本+10年运维成本)评估方案,选取TCO最低的方案。PUE最低的方案不一定TCO最低;
节能环保-通过提高能效降低长期的运营成本,在业务可承受的风险范围内,采用创新的节能技术;
可管理性-用智能系统和监控技术手段,实现自动化运维管理,用以有效支撑数据中心越来越大的规模,减小单位设备运维人员数量,减少人为错误的发生机率。