运营商积极布局智算中心

发稿时间: 2023-09-28 15:39 来源:中国电信业 作者: 李贝 王鑫 郭熹 赵慧英 程新洲 2023-09-28
分享X

AI计算基础设施包含了计算、存储、网络硬件基础设施,以及多样化的机器学习框架、算法以及相关的工具软件等“硬、软”件两个方面, AI计算基础设施离不开算力的支撑,本文重点剖析智算中心作为主要的AI计算基础设施,通信运营商该如何布局。文章分析了我国当前智算中心布局经验,提出了通信运营商布局智算中心的意义及相关内容、举措,供通信运营商借鉴。

IST_16279_04590.jpg

我国AI计算基础设施产业化发展方向

放眼全球,谷歌的张量处理单元(TPU)、特斯拉的NPU、英伟达的数据流处理单元(DPU)等已在AI算力资源方面实现进步。截至2022年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模约2000万台,算力总规模超过150EFlops(每秒 15000京次浮点运算次数),排名全球第二。

当前,我国智能计算产业具有如下特点。

端网智能芯片方面,正在加快新兴芯片企业发展和传统芯片企业转型。端侧智能计算机芯片发展速度快,以FPGA、ASIC芯片类型为主的新兴芯片企业主要聚焦计算机视觉、语音识别等终端推理应用,传统SoC及多媒体芯片企业如中星微、杭州国芯等正在积极转型。

存储芯片方面,产业合作加深共同推进技术发展。以长江存储、紫光集团的存储战略为例,通过与Cypress公司、中国科学院微电子所技术合作,三维闪存技术不断实现突破。系统设备方面,产品、算力等AI计算基础设施加速布局。围绕智能计算基础设施布局,华为聚焦昇腾等生态,构建全场景多样性智能计算平台;浪潮围绕智能超算、存储和超融合一体化等算力,提供多领域全栈全场景智能解决方案。

计算技术方面,推进技术商业化。阿里云等企业积极推进量子计算技术商业化,本源量子正式上线首个国产超导量子计算云平台。

通信运营商布局智算中心探索

规划建设模式及内容

建设模式上,目前智算中心建设分为企业独立投资建设、国有企业出资建设、政府与企业联合成立建设运营公司三种建设模式,三种模式比较见表1,主流建设模式由政府独立投资建设,政府对建设项目进行直接投资和管理,建设资金主要来自地方政府财政资金、专项债券发行等,智算中心所有权归政府所有。随着算力中心规模不断扩大,企业不断入局,产业不断壮大,企业独立投资建设、高校/科研机构独立投资等方式出现,通信运营商布局智算中心建设模式可考虑后两种方式,合作协议模式下,协调成本太高且随着智算规模不断扩大,协作效果将变差,需成立专职机构,但面临退出难度大、监管风险,以及建立新的组织实施过程难度大,因此通信运营商布局智算中心建议采用国有企业出资建设方式。

表1 智算中心建设模式

image.png

建设内容上,当前运营商C分子公司分别进行了新客服全栈国产化改造、打造了高速公路智能分析联合解决方案等,下一步,既要持续推进AI算力建设,形成让AI算力中心的点及面的全国战略型网络,又要建设全国统一的AI大算力平台来集中优势资源、降低投资成本,共同加速人工智能的应用和渗透。

运营主体和方式

通信运营商已拥有成熟的网络基础设施,在布局智算中心上需要考虑运营主体等内容。

运营主体方面,可考虑“建 - 运”一体化和“投 - 建”合作模式两种方式具体见表2,运营主体合作模式跟随建设模式同步采用对应模式。例如,为了约束经营行为,“建 - 运”一体化可由政府对运营公司进行算力利用率等指标的考核,运营收益可以由运营方和政府部门共享。“投 - 建”合作模式需要建立新的组织,实施过程难度大。

表2 智算中心运营主体合作模式

image.png

运营服务方式,根据面向对象不同分为服务于产业发展和服务于科学研究两类。服务于产业发展指以政府、产业联盟、园区为着力点,服务于园区、企业、行业的发展,为人工智能产业向更深更广行业应用发展提供算力保障。服务于科学研究指服务于高校、科研院所等,为高校师生、科研人员的科研工作提供算力、算法等支撑。不同场景所需算力不同,建议智算中心建成后,可开放和提供针对不同场景的不同规模算力定制服务。例如通信运营商可为基础研究、前沿科学技术研究提供支持,还可以加强校企合作推进国家重点科研攻关及解决企业卡脖子问题。

运营内容

通信运营商布局智算中心后需要进行数据服务、算力服务、算法服务、生态服务四个方面的内容运营。

数据服务指为服务购买方提供例如数据存储、数据清洗等多元化的数据服务。算力服务指服务购买方无须关注底层算力芯片和技术细节,通过选择业务场景、算法模型等获取服务方案。算法服务指在模型训练成本和技术门槛“双高”的情况下,依托智算中心提供的语音、图像、自然语言处理、决策等领域的算法能力,实现创新智慧应用。生态服务指打造人工智能开放服务平台,实现不同主体的线上汇聚,实现多方融合性、深度化合作探索。同时围绕购买服务方的共性需求,发掘研判行业动态和用户需求,提升智算中心的共性支撑能力,加速开发各种各样的行业智慧应用,引领探索新的业务场景,构筑新的产业和生产力。

279384594.jpg

布局举措

智算中心作为基础设施,为用户提供了算力等各种智能服务,支撑了智慧城市、智能制造、智能家居以及智能医疗等行业和社会的智慧化转型。布局智算中心可以采取如下举措。立足现有业务,面向演进的业务应用。立足运营商云边端全连接的智能网络,使用AI算力优先满足传统业务升级AI应用、政企业务适配应用,面向新技术、新应用,使用AI算力适配新业务发展。

积极参与和实践AI计算基础设施标准创制。包括从软件到硬件,从芯片到数据中心,持续推动着信息技术的发展,另外算力的提升,有效实现绿色数据中心,联合形成基于AI计算基础设施的绿色节能新评估体系和标准,在资源节省、环境改善上实现了良性循环,促进生态与环境双提升。

躬身入局生产算力、聚合算力、调度算力、释放算力。适时入局 AI 计算产品阵列、领先训练架构、拥有功能最全的 AI 管理平台等科创公司,联合产业链进一步提升数据中心的处理能力,作为基础设施智算中心需要实现互联互通,包括统一的调度、监控、运维等管理上的互操作,网络打通、业务迁移等业务上的互联接,以及数据上的互流通,实现容灾、数据共享等。

(项目资助:国资委攻坚工程278项目)

 作者单位:中国联合网络通信有限公司研究院

新闻附件:

相关新闻