游戏开发商Nexon将为其链游
大干快上,大模型加速数据中心行业洗牌
原文来源:钛媒体
作者:张帅
图片来源:由无界 AI生成
大模型,是数据中心产业十年一遇的变革。
相比于以GPT为代表的大模型带来的现象级热度,数据中心产业太不「性感」了。长久以来,数据中心产业较为成熟,但是重资产、长周期、年折旧额高的属性,注定了它不是一门互联网式的快生意,也缺少激动人心的故事。
但不论是互联网,还是如今的大模型,数字世界都得依靠物理基础。简而化之,AI产业的最上层是各种应用,如人脸识别、工业大脑、智能客服,当然还有ChatGPT,支撑这些应用的则是云计算平台,承载了大模型和算力调度等软件功能,数据中心在更下一层,“风、火、水、电”基础设施,加上芯片、服务器等,海量数据的存储和计算都在此发生。
上层应用技术,直接影响底层数字基础设施,数据中心层级的变化往往容易被忽略,实际上,通信、互联网、云计算和大模型的发展,分别对应机房、数据中心、云数据中心、智算中心(AIDC)的不同形态,尤其是大模型代表的人工智能技术,可能比此前所有的影响加起来还要大。
中国信息通信研究院云计算与大数据研究所所长何宝宏表示,“今天的数据中心仍然是传统技术和创新技术混合,再过大概十年,我们会进入数据中心原生的时代,这些技术是土生土长专用于数据中心,比较有代表性的如液冷技术、智算中心的飞速发展。”
2023年,数据中心行业之间的交流频率明显多了起来,在产业变换的关键节点,一面是客户需求驱动下的“大干快上”,另一面则是未被厘清的新技术路线,大模型让数据中心厂商隐约嗅到了行业洗牌的味道。
“数据中心大干快上,就等GPU了”
过去一年,中国数据中心产业开启了一场算力进化的新征程,国家政策点名了方向。2023年10月份,工信部六部委印发《算力基础设施高质量行动计划》,首次提出了算力中心相关的概念和发展要求,将通用数据中心、智算中心、超算中心都纳入了算力基础设施的内涵。
其中明确到2025年,算力规模要超过300EFLOPS,智能算力占比达到35%以上,重点行业的核心数据、重要数据的灾备覆盖率要达到百分之百,每个重点领域要打造30个应用标杆等。
与此同时,数据中心全面智算化,截至2023年上半年,全国在用的数据中心总规模超过760万标准机架,算力总规模达到了197EFLOPS,已经位居全球第二。新增的算力设施中,智能算力的占比超过了50%,成为了增长的新热点。
根据科智咨询最新统计的数据,2023年1月份到12月份初,全国立项规划建设的智算中心的项目数量达到118个,其中规划算力大于1000P的项目16个,大于500P以上的26个,大于100P以上的项目56个。
而对于大部分数据中心服务商来说,今年的主旋律就是一边大干快上新建智算中心,一边等AI算力卡,更准确地说,是主要依赖GPU供应市场份额90%的英伟达,否则只能选择性能和产能不足的其他供应商。
数据中心服务的核心是服务器,其架构设计也是围绕服务器,当服务器发生任何一种变化,数据中心就要相应做出调整,结合客户预算和需求做兼容或创新的改变。大模型火爆之前,纯GPU服务器的数据中心很少,充其量就是大规模数据中心有少数几个GPU服务器机房,而且由于GPU的成本高昂,只有大型互联网等企业才有相应储备。
一位数据中心业内人士提到,“2023年是算力大元年,全行业都在抢GPU卡,而且是疯狂地抢,因为受到贸易政策的影响,现在进入到暂缓供应的阶段,目前大家还是在积极部署数据中心,预计未来一段时间行业会有非常大的发展空间。”
“理论上客户需求的紧迫性走在我们前面,但是客户也受限于上游GPU的供应,能不能按计划拿到足量的算力卡是关键。我们与算力客户先做算力中心规划设计,先把符合需求的算力中心楼建造出来,分阶段交付机电等,让客户有卡就能立马上架”,普洛斯数据中心平台产品部副总裁韩玉说。
韩玉透露,今年接到的需求中,超过七成以上都是智算中心的需求,由于大模型对算力的需求异常旺盛,大模型厂商对数据中心建设的时间表也一再压缩。
在2014年左右,云数据中心的建设从空地开始,到机电交付是11个月,在2019年,行业领先的水平大概能做到9个月左右,今天数据中心可以做到从空地开始建设,到测试完成上架大概在7个半月左右。