ChatGPT火了,算力不够怎么办?
0人参与0评论
作者/ IT时报记者 范昕茹
编辑/ 潘少颖 孙妍
如果说去年的互联网热词是元宇宙,那么今年的科技热词一定是GPT。
作为科技圈的新宠,ChatGPT一经推出,两个月内便吸引了1亿用户注册,成为用户增长最快的应用。GPT-4接入Office之后的一系列演示,更是让人见识到AI大模型的威力。ChatGPT的成功,也让AI大模型成为新的资本追逐对象。
3月20日,百度推出基于大模型的AI聊天机器人“文心一言”,成为国内首个冲进GPT赛道的互联网企业;紧接着,创新工场董事长兼CEO李开复高调宣布创建AI2.0公司,华为CEO任正非也将算力建设视为未来的方向之一。
华西证券预测,全球AI软件市场规模将在2025年达到1260亿美元,2021年到2025年复合增长率为41.02%。随着各大公司争相进入AI大模型领域,一个所有企业都必将面临的问题是:算力从何而来?
ChatGPT催化
AI算力平台发展
众所周知,一个大模型的建立背后需要投入大量的算力。公开数据显示,ChatGPT的训练参数达到了1750亿、训练数据45TB,每天生成45亿字的内容,支撑其算力至少需要上万颗英伟达的GPUA100,单次模型训练成本超过1200万美元。
尽管GPT-4发布后,研发团队并未公布GPT-4参数规模的具体数字,OpenAI CEO山姆·阿尔特曼还否认了100万亿这一数字,但业内人士猜测,GPT-4的参数规模将达到万亿级别,这意味着其训练需要更高效、更强劲的算力来支撑。
随着算力需求的急速增长,我国跨平台、跨区域的算力一体化平台也随之出现。
2月24日,宁夏电信、北数所、中科曙光支撑数字宁夏公司率先推出国内首个东数西算一体化算力服务平台。该平台是支持算力交易调度的应用系统,为智算、超算、通用算力等各类算力产品,提供算力发现、供需撮合、交易购买、调度使用等综合服务。3月3日,北京市通信管理局、中国信息通信研究院、中国科学院计算机网络信息中心与天翼云共同发布北京算力互联互通验证平台。此后,贵州、上海等地也纷纷将算力平台的建设纳入到城市数字化建设进程之中。
在传统的算力交易过程中,用户购买算力服务时,需要咨询多个算力企业,企业也是各自为战,缺乏统一的资源调配,效率无法最大化,算力资源存在一定程度的浪费。但现有的算力平台大多实现了多家服务商接入。例如北京算力平台已经接入天翼云、商汤等服务商,宁夏算力平台也已经和华为、阿里、亚马逊、微软、天翼云等算力服务商达成了战略合作协议。
算力平台更像是一个淘宝,算力服务商可以在平台上进行算力产品的展示销售,算力需求方可以根据自己的需求购买算力产品。
相比于一对一的供需方式,融入了多个算力服务商,算力商品更丰富的算力平台将为算力需求方提供更多的选择。随着智能算力需求的急速增长,相比于单个算力服务商,跨平台、跨区域的算力一体化平台将为企业提供新的选择。
算力向西
普惠算力成为可能
当ChatGPT取代元宇宙成为未来科技发展方向时,另一个不可忽略的事实是,尽管ChatGPT已经让行业看到了商业化的希望,但截至目前,OpenAI仍未实现盈利。对于一些中小企业或研究团队来说,算力的成本问题将进一步凸显。
2月20日,复旦大学自然语言处理实验室面向公众推出国内第一个对话式大型语言模型MOSS,然而当天,MOSS便因服务器流量过载,陷入瘫痪。受限于服务器规模和资金,复旦大学计算机科学技术学院教授邱锡鹏和他的MOSS团队最终随机挑选了近千名报名用户发送了内测邀请码。目前,MOSS服务器的最大容纳人数在几万左右。
当成本要素成为算力中的关键考量因素,计算需求将进一步寻找价格洼地,这也将促使算力网络进一步向西部延伸。
2022年,我国开始实施“东数西算”战略,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。
但一直以来,“东数西算”面临的一个问题是,“东数”并不愿意“西算”。宁夏电信副总经理白冰告诉《IT时报》记者,过去几年,算力企业之间的竞争大多集中在通用计算领域。由于数据和计算需求大多集中在东部,加上西部算力基础相对较弱,考虑到网络时延和运算效率的问题,尽管东部运算成本更高,但东数东算仍有盈利空间。另一方面,随着通用算力需求的饱和,服务商之间的竞争也进入“白热化”,服务商纷纷打起了价格战,西部的价格优势并不明显。
这一情况或将随着运营商“网络骨干直连”的建设和智算需求的增长而产生变化。天翼云的一份数据表明,随着电信算力网络的落地,从贵州到北京的网络时延已经可以控制在20ms之内。国家发改委制定的《全国一体化大数据中心协同创新体系算力枢纽实施方案》显示,枢纽节点数据中心端到端单向网络时延原则上在20ms范围内,而城区内的数据中心作为算力“边缘”端,数据中心端到端单向网络时延原则上在10ms范围内,低于20ms的时延已经能够满足除了金融交易、车联网等热门业务之外的其他业务需求。而如今大热的AI大模型对时延的敏感度更低,其平均网络时延可以在100ms以上。
“时延将不再成为东数西算的阻碍。”在白冰看来,算力平台的出现,能够打破东西部算力需求不平衡的现状,实现东西部之间的算力流动,做到真正意义上的东数西算。而另一方面,由于西部资源更为丰富,算力基础建设的成本更低,算力平台的出现,也让为中小企业提供更加普惠的算力成为可能。
计算平台的下一站:
生态竞争
算力平台建设的初衷,在于打通平台、东西部的节点,互联互通,实现跨平台、跨地域的算力交易。尽管现有的算力平台将“互联互通”作为平台主打,但想要实现完全意义上的“互联互通”仍有难度,其中一个难题便在于实现跨平台的算力调度。
白冰告诉《IT时报》记者,由于行业内对算力的计算还未有统一的换算标准,各个服务商平台的架构也各不相同,这就导致想要跨平台进行算力调度十分困难。
所谓算力调度,指的是平台在将复杂的计算任务分解后,根据平台自身的算力分布情况,对各个节点的算力进行调配,从而提供更合理的计算方式,达到提升计算效率、降低计算成本的效果。现阶段,几乎所有的算力服务商都拥有自己的算力调度平台。华为相关数据显示,通过平台的算力调度系统,能够使算力效率提升30%。
目前,宁夏算力平台已经实现了与不同算力服务商调度系统的互通,平台内部的多云管理系统也能对多个算力调度系统进行管理,但跨服务商的算力调度仍需要时间。
图源:东方IC
不过,随着区块链在算力平台上的应用,跨服务商的算力调度将成为可能。白冰告诉《IT时报》记者,新技术可以绕开服务商的底层架构,将各个服务商平台的算力原子化,从而实现统一定价,统一调度。他透露,这一功能将于2023年底前实现。
“当算力具有了金融属性,才真正能够像水电一样可交易、可流转。”白冰说,“届时,算力互联平台拼的将不仅仅是成本,还有算力的质量和服务能力。”也就是说,当跨平台的算力调度和交易成为可能,算力互联互通平台的竞争也将进入下一站:生态竞争。
如今,依托国家“东数西算”战略,处于西部计算节点上的城市正依托自身优势,积极建立打造新的智算生态链。宁夏正积极发挥产业链核心企业科技引领和带动作用,打造产业链互利共赢的生态圈,促进大中小企业创新链、产业链、供应链、资金链、服务链、人才链的全面融通。
排版/ 季嘉颖
图片/ MOSS 东方IC