继南水北调、西电东送之后,又一超级工程--东数西算全面启动,数据存储产业有望获益。东数西算,就像南水北调、西电东送一样,是全国一体布局。东数西算对新型数据中心提出供需优化、绿色集约、互联互通目标。浪潮作为新存储首倡者和引领者,基于G6存储平台助力数据中心存好、用好、管好海量数据。
近日,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设算力枢纽节点,并规划了10个数据中心集群。至此,东数西算工程全面启动。实施东数西算工程,需要构建大批新型数据基础设施,存储作为数据要素核心载体,在东数西算新基建中扮演着重要角色。
东数西算带动大批新建数据中心
当前,新一轮科技创新和产业变革正在重塑全球经济结构。算力作为数字经济的核心生产力,数据作为核心生产要素,受到社会广泛关注。数据显示,到2025年数据创建总量将大幅增长至175ZB,复合年均增长率约为26%。现在每小时创建的数据比过去20年前一整年创建的数据还多。同时全社会对算力需求也十分迫切,截至目前,中国数据中心规模已达500万标准机架,算力达到130EFLOPS(每秒一万三千亿亿次浮点运算)。随着数字技术向经济社会各领域全面持续渗透,预计算力每年仍将以20%以上的速度快速增长。数据和算力相辅相成、缺一不可,加快推动算力建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,支撑经济高质量发展。
其实,“全国一体化大数据中心协同创新体系算力枢纽实施方案”早在2021年5月已提出,经过近一年酝酿,如今全国一体化大数据中心体系总体布局设计终于完成。可以预测,而后将有一大批新建数据中心建设围绕国家圈定的这“8个枢纽、10个数据中心集群”展开。国家发改委创新驱动发展中心副主任徐彬在接受媒体采访时说道:“从经济上来看,(东数西算)每年能带动投资4000亿元。”
建设新型数据中心:“软硬一体”比“软硬分离”更具优势
建设大型数据中心,业界可选的数据存储方案有两个,一个是软硬一体的方案,即超大规模分布式存储平台,另一个是软硬分离,采用“软件定义和通用服务器”。这两种技术路线一直是被热议,业界对其有不同理解,但对比看,经过十多年发展,“软硬一体”超大规模分布式存储的部署模式,比“软硬分离”模式在部署、运维等方面更具优势,是构建超大规模数据中心的理想选择。
在软硬分离模式中,存储硬件会限制软硬分离模式部署的成功。硬件如果临时考虑,而非提前规划,最终导致整个系统无法达到承诺的服务级别和效果。软硬分离模式的成功标准,如成本、稳定性、IOPS等KPI,很少由IT部门和业务部门打成共识后定义。软硬分离模式部署,通常需要冗长的内部采购流程和复杂的跨部门协作,IT部门还需要进行验证和集成。
在运维方面,软硬分离存储使用十分复杂。在成本方面,软硬分离产品让企业在前期DIY时很灵活,但因为产品不是工业规模化生产,所以成本不一定占优势。软硬分离产品为了软件的通用性,牺牲了针对硬件的优化,难以发挥硬件最大价值。在供应商可选方面,软硬分离让硬件通用,但同样会导致软件商锁定。
整体看,软硬一体的存储方案战胜了软硬件解耦方式,成为超大规模数据中心建设的首选方案。在整个使用生命周期内,软硬一体的分布式存储平台能够满足业务对存储系统大容量、高效可靠、绿色低碳、智能运维等多方面的需求。
正是由于这些原因,核心行业数据中心大多采用软硬一体的专业存储设备。以运营商为例,自2017年起,运营商组织了多次分布式存储集采,在全国六大区构建了8个网络云(NFV)资源池,一定程度在业界树立了标杆,说明软硬件一体的采购,获得超大规模数据中心建设的认可。
东数西算新基建面临新需求、新挑战
东数西算巨大的投资带动作用,令产业界兴奋不已。但“樱桃好吃树难栽”,东数西算超级工程,面临的挑战也不容小觑。以数据中心建设为例,在保障安全可靠的基础上,东数西算的数据中心需要避免零散建设和“一哄而上”,要统筹布局、优化供需、循序渐进;同时要响应“双碳”目标,推动数据中心绿色集约发展。
挑战一:数据中心如何多元并存、弹性扩容?
东数西算要求集群内数据中心平均上架率不低于65%,且数据中心建设要最小化起步,避免资源浪费,今后还将对集群发展情况进行动态监测,适时扩大集群边界或增加集群,实现有序、健康发展。
对此,浪潮基于存储平台战略,推出了融合“块、文件、对象、大数据多种数据服务”的分布式存储平台。浪潮存储基于极简架构能够和Cinder(块接口)、Manila(文件接口)、Swift/S3(对象接口)以及CSI(容器接口)对接,并支持HDFSPlugin(大数据插件),实现一套存储支撑一个数据中心业务,提高了数据共享效率,同时所有设备实现统一管理,设备维护和管理更加高效。随着业务增长,浪潮分布式存储可以通过扩展节点增加容量及性能,单一集群最高支持5120个节点横向扩展,单一命名空间支持EB级容量;而通过在一个数据中心内部署多个集群,以ZB级数据空间为东数西算新基建“挑大梁”。
创新者的能力往往是多方面的,浪潮存储在以极致容量、极简架构承载超大规模数据中心的同时,还具有资源灵活调配、快速部署、场景定制等差异化优势。
首先,浪潮存储能够在数据中心所需存储类型发生巨大变化时,将原有存储资源释放以用于配置新的存储空间,从而避免资源浪费和重复投资。浪潮存储曾携手大型运营商,完成上万分布式存储节点的调试和上线,打造出一套能够灵活承载多元业务的网络云平台,成为超大规模数据中心建设的典范。项目实施中,浪潮存储基于多合一架构,打造了块集群、文件集群、对象集群多个集群,满足多元业务、多类型数据存储需求。
其次,东数西算新基建需要承接千行百业的丰富应用,这些应用对存储的需求各不相同。浪潮存储能够以客户为中心,针对业务场景进行定制。比如,容器(Docker)作为云化的一部分,目前在互联网、金融、电信等行业,有越来越多的企业用户开始部署容器,数据显示,容器采用率从2018年的49%增加到57%,这项技术正在成为主流。浪潮存储已经率先完成CSI接口对接,支撑用户快速、轻量部署新应用。又如浪潮面向网络云新场景与运营商紧密合作,在Redfish技术上进行充足验证和匹配,成为最早满足运营商Redfish接口要求和Redfish测试规范的厂商之一,实现所有监控及故障告警通过Redfish向数据中心物理资源管理系统传递。
最后,东数西算的数据中心建设有可能需要所有权和运营权分离,对于东数西算的超大规模数据中心来说,在早期建设完成后,后期运营可能朝着开放、透明、分权制衡的方向演化。浪潮存储基于跨地域的多中心化部署,将热、温、冷不同使用频率的数据资源部署在同一数据中心内或跨多个数据中心的不同性能的资源池中,比如将热数据放在高性能SSD资源池,温冷数据放在大容量HDD资源池,实现全局“一盘棋”,让数据资源均衡、合理分布。
此外浪潮存储还能够面向不同用户场景需求进行联合定制,比如浪潮存储联合运营商开发了多源零拷贝、ACL高级权限管理等技术,前者能够将一份原始数据同时提供给多个企业使用,化解海量数据“大象搬家”的难题并大幅提高资源利用效率;后者能为不同使用者设置不同权限,实现数据所有、使用和管理三权分离,为加速数据价值挖掘、释放数据要素价值提供了支撑。
挑战二:数据中心如何绿色、高效运转?
为坚决避免数据中心盲目发展,在当前起步阶段,围绕8个算力枢纽规划设立了张家口、长三角生态绿色一体化发展示范区、芜湖、韶关、天府、重庆、贵安、和林格尔、庆阳、中卫10个数据中心集群,并明确了绿色节能发展目标,要求核心数据中心枢纽电能利用效率指标(PUE)控制在1.25以内,且可再生能源使用率要有显著提升。
碳达峰、碳中和是中国重要战略,作为世界上能源生产和消费大国,要实现这样的目标并非易事,其中数据中心已然成为“耗电大户”。目前全球数据中心耗电大约占据全球每年总用电量的2%-3%,电费在数据中心运营成本中占比超过50%。而在国内,全国数据中心的耗电量已连续八年以超过12%的速度增长,未来占社会总用电量比例将持续增长,预计到2030年中国数据中心用电将突破4000亿千瓦时,占比升至3.7%。“少耗能、耗新能”是未来数据中心发展的重要方向。
降能耗是靠技术创新实现的。风能、光伏发电能够为数据中心提供新型能源,闪存、高密设备、模块化机柜、精密空调、液冷、热回收利用等新技术,能够减少在数据处理、用电、散热等方面的能耗。比如,相对于HDD机械盘阵,在相同的容量下,全闪存储电力能耗最高可降低80%,能够大幅降低数据中心TCO总成本,有效推进数据中心低碳运转。又如,水电、风电、光伏等非化石能源还有很大发展空间,到2020年年底,非化石能源在全部能源消费中的比重还不到16%,单在能源消费的增量中,非化石能源所占比重过去十年间已经从13%大幅提升至40%。如果数据中心能够大幅提升非化石能源使用比例,将为2030年前全国碳达峰做出实质贡献。
浪潮存储一直在节能、提效方面探索和创新,早在2019年就提出新数据时代前瞻洞察,推出“绿色节能和性能兼备”的全闪存储旗舰产品。浪潮全闪存储基于“iTurbo2.0智能加速引擎”,构建了由傲腾和NVMe闪存盘组成的智能分层的存储资源池,通过软硬联合调优大幅提升了存储性能并降低了空间和能源消耗,不仅在4U空间内最高可容纳1PB数据;还在SPC-1国际基准测试中多次打破全球性能记录。截止目前,浪潮存储在六大行、运营商、两桶油等行业核心用户中批量部署,单一用户累计部署上万节点,通过供电、散热优化和智能运维,实现能耗降低20%、空间利用率高达90%,推动数据中心绿色、高质量发展。
不仅如此,浪潮存储还参与了全闪存储标准制定,在国家市场监管总局中国标准化研究院公布的2021年企业标准领跑者榜单中,浪潮两款高端全闪存储HF18000和HF6000上榜,荣获数据中心存储阵列企业标准领跑者称号。同时,浪潮还推动建立存储产业技术创新战略联盟,与清华大学、华中大共建产学研共同体,以促进存储创新技术研究,目前浪潮存储专利授权总量中国领先。
挑战三:超大规模数据中心如何智能运维?
西部地区数据中心专业人员储备、管理运维方面存在挑战。一方面西部地区可以通过加快培养数据中心运维人才,来提升行业服务水平;另一方面也可以基于大数据和AI技术,构建“自动驾驶”的数据中心,以技术创新来化解运维难题。
浪潮存储将人工智能技术融入存储系统的管理和运维,打造自动驾驶的存储系统。浪潮存储基于智能统一存储管理平台InView利用大数据和AI技术对硬盘、应用的数据进行建模和预测,14天内磁盘故障预测准确率高于90%,在保障业务连续性方面起到关键作用。在成都智慧交通、NFV网络云等行业新应用中,浪潮基于智能统一存储管理平台InView,保障项目7X24小时顺利进行。
值得一提的是,浪潮存储不仅能管好数据中心内的数据,还能优化数据远程搬运的销售。基于远程复制、WAN加速等创新技术,浪潮存储能够提升异地跨数据中心海量数据传输效率。基于WAN广域网加速技术,浪潮存储通过数据流压缩、固定块切割和多数据流并发,将远程传输性能提升高达10倍、延时降低10倍,帮助海量数据异地迁徙和灾备。
小结:坚守高端品质为东数西算新基建提速
伴随新技术、新应用不断涌现,中国数字经济产业引领势能突出,发展势头强劲。数据显示,从2020年到2025年数字经济核心产业增加值将从7.9万亿提升至13万亿,成为驱动GDP增长的引擎。其中东数西算工程,将成为中国数字经济发展的核心基础设施。作为全球前五、中国前二的存储厂商,浪潮存储将坚守高端品质,基于存储平台战略提供集中式存储、分布式存储、备份和归档存储四大平台型产品,满足数据全生命周期管理需求,打造“安全可靠、绿色高效、易管易用”的新型数据基础设施,推动东数西算迈向新征程。