宁夏移动发布全国首个对外提供服务的大规模HGX A800算力资源池

2023616日,宁夏移动全国首个对外提供服务的大规模HGX A800算力资源池已开放免费测试,最快48小时开通测试环境

如今,人工智能(AI)在以大模型为核心实现着更加快速的发展,并正在向一个崭新时代全速迈进。“大模型在改变人工智能的同时,也在改变着全世界”似乎在一夜之间成为科技界公认的客观事实。在人工智能时代,AI算力就是电,AI计算中心就是电厂。目前,人工智能的发展已提升到国家战略层面,加快人工智能产业发展,保障和提供充沛的AI算力,对于赢在AI时代的国家、城市和企业来说,已经是迫在眉睫的问题。

GPU订单激增,交付周期一拖再拖

截至目前,拥有云计算业务的中国各互联网大公司都向英伟达下了大单。据了解,字节今年向英伟达订购了超过10亿美元的GPU,另一家大公司的订单也至少超过10亿元人民币。仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。百度今年向英伟达新下的GPU订单高达上万块,数量级与Google等公司相当。据了解,字节跳动的订单包括了超过10万块A100和H800芯片,其中H800是今年3月开始投产的,可能需要到今年年底才能交货。

对英伟达数据中心GPU的竞争也发生在全球范围。不过海外巨头大量购买GPU更早,采购量更大,近年的投资相对连续。2022年,Meta和甲骨文就已有对A100的大投入。Meta在去年1月与英伟达合作建成RSC超级计算集群,它包含1.6万块A100。同年11月,甲骨文宣布购买数万块A100和H100搭建新计算中心。现在该计算中心已部署了超3.27万块A100,并陆续上线新的H100。微软自从2019年第一次投资OpenAI以来,已为OpenAI提供数万块GPU。今年3月,微软又宣布已帮助OpenAI建设了一个新计算中心,其中包括数万块A100。Google在今年5月推出了一个拥有2.6万块H100的计算集群ComputeEngineA3,服务想自己训练大模型的公司。

需求飙涨下,英伟达GPU交货周期也被拉长,之前英伟达GPU拿货周期大约一个月,现在基本需要三个月或更长。另外,部分新订单“可能要到12月份才能交付”。供需的巨大鸿沟面前,在这一情形之下,众多客户也不得不“勒紧腰带”。国内可用于训练AI大模型的A100大约有4万-5万个,供应相当吃紧,一些云服务厂商已严格限制内部使用这些先进芯片,以将其保留至需要强力运算的任务。

宁夏移动搭载HGX A800算力资源池上线运营

AI算力如此重要,但很多企业缺乏足够的资金来搭建自己的AI算力,且在英伟达GPU供货紧张的局面下面临无货可买的困境。那AI算力需求该如何被满足,国家、城市又该如何提供足够的AI算力支持,推动AI产业发展并赢得AI时代的竞争力呢?

宁夏移动依托国家东数西算核心节点优势,快速响应市场需求,推出大规模高性能集群算力,对希望在大模型时代实现快速创新的企业提供专业的算力出租和模型辅助训练服务。

宁夏能源富足、气候冷凉、区位优势明显,中卫市是唯一拥有全国一体化算力网络国家枢纽节点和国家新型互联网交换中心两个节点的双中心城市,算力产业基础完备、发展前景广阔。依托优越的自然禀赋,宁夏算力产业近年来风生水起。自治区政府大力实施数字赋能计划,将数字信息产业列入“六新”产业重点打造,将“东数西算”工程列入20个重大项目重点推进,高标准建设中卫数据中心集群,打造面向全国的算力保障基地。将先天“风光”优势转化为后发动能,构建集聚发展生态,打造“西部数谷”。

宁夏移动已在全区建成3座大型数据中心和5个地市边缘数据中心,平均PUE1.25以下,其中中卫数据中心是西北五省唯一获得工信部双认证的数据中心,也是宁夏规模最大的数据中心园区。作为国家电子政务“一主三备”的西部云备份节点,承接国家多个部委及宁夏各厅局委办的IDC、云、大数据和网络服务,引入美团、阿里、亚马逊等一批国内外头部互联网公司,并为宁夏本地最大的千亿级商业银行提供了完全定制化的主备双中心服务。

宁夏移动以网络强算力,传输干线具备3套独立平面传输网,全省光缆总长度达90万纤芯公里,光纤整体覆盖率达95%以上;中卫节点已升级为中国移动骨干网络核心节点,互联网出口总带宽12.6T,占宁夏区域算力承载63%,直连北京、西安、杭州等全国26个主要城市;建成跨境服务POP点,政企专网连通7个国际局+182个城市;打造“12580”时延圈(银川、中卫数据中心间传输时延1ms;宁夏区内城市群间传输时延2ms;宁夏与西北各省间传输时延5ms;宁夏与京津冀地区间传输时延8ms;宁夏辐射东部枢纽地区传输时延10-20ms),距离最远的东南枢纽地区传输时延10-20ms,可实现传输网“0”丢包、”0”抖动,满足95%以上业务场景需求。

本次发布的算力资源池就位于国家五星级数据中心—中卫移动数据中心,单集群规模可扩展至256台,采用全IB互联组网,可实现算力资源的线性增长和GPU资源的充分利用,经opt-66b大模型实际训练验证,相关性能指标与微软平台发布的测试结果基本一致,达到目前业界的最高性能水准。

动力保障方面,中国移动(宁夏中卫)数据中心采用双路市电引入、配置安全可靠的2N架构 UPS系统、应急发电机组,为客户提供最高99.999%的电力安全保障。绿色节能方面,园区采用高能效制冷机组、循环水泵等高效节能的硬件以及DCIM等节能软件的配套使用。同时冷源系统采用冷机+板换+冷却塔的结合方式,气温较高时使用冷机模式、气温较低时采用板换模式,投运后整个园区的全年平均电能利用效率(PUE)可降低至1.25。在用电方面,数据中心用电采取参加跨省电力交易,可在生能源电力比例达到100%。

目前,宁夏移动智算平台已经正式上线开通运营,面向客户开放测试,48小时即可开通免费测试!欢迎咨询

宁夏移动AI智算平台门户网站://slmh.ninghuicun.com

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部