云计算推动“人工智能+”的发展。

2024-04-25 12:33:59   编辑:颜彪雁
导读目前,新一代人工智能技术正在快速发展,并成为推动现代产业变革的关键力量。今年政府工作报告首次提及人工智能+,各地积极探索推动人工智...
目前,新一代人工智能技术正在快速发展,并成为推动现代产业变革的关键力量。今年政府工作报告首次提及“人工智能+”,各地积极探索推动人工智能深度赋能实体经济,开启了人工智能在各行各业广泛应用的新时代。
随着人工智能技术和应用创新的不断加速,模型复杂度和数据量急剧增加,对新型基础设施建设,包括算力等,提出了新的需求和要求。建立适应人工智能时代的高质量算力服务系统迫在眉睫。
近日,国家信息中心的信息化和产业发展部发布了《“人工智能+”时代公共云发展模式与路径研究》报告。该报告指出,公共云将成为解决我国在人工智能+时代中算力短缺和高成本问题的关键途径。
公共云是指向广大公众提供云计算资源的服务,通过整合多种算力资源并采用在线方式,向用户提供简便易用、几乎无限扩展的计算服务。其实质在于将云计算资源规模化并进行广泛分享。国家信息中心信息化和产业发展部主任单志广指出:“公共云能够以最大化资源利用效率的方式,促进我国算力供应能力的提升,通过规模经济效应推动算力门槛降低,从而让更多用户享受到普遍和普惠的计算服务。”
大型模型的应用受限于缺乏足够的智能计算资源。
大型模型在应用中受限于缺乏足够的智能计算资源,这已成为一个关键阻碍。
根据应用和功能特性,计算能力可分为基础计算能力、智能计算能力、超级计算能力三类。基础计算能力主要依靠CPU芯片,用于满足基础的通用计算需求,比如网络购物、游戏等;智能计算能力则采用GPU、FPGA(现场可编程门阵列)、ASIC(专用集成电路芯片)等人工智能芯片的加速计算平台,主要应用于人工智能的训练和推理计算,比如语音、图像和视频处理;超级计算能力则由超级计算机等高性能计算集群提供,主要应用于尖端科学领域的计算。
在智能算力领域,人工智能应用和大型模型训练等方面,像AIGC(生成式人工智能)这样的代表,所需的数据量和参数规模呈爆炸性增长,带来了对智能算力的极大需求。举例来说,GPT-3模型参数达到了1746亿个,进行一次训练需要每秒进行数万亿次的计算,并且需要持续3640天。而GPT-4的参数数量增加到了1.8万亿个,是GPT-3的10倍,训练所需的算力提升了68倍,在25000个A100芯片上需要训练90至100天。
2023年3月,百度发布了文心一言,接着4月华为发布了盘古大模型,阿里巴巴也发布了通义千问大型模型,商汤科技公布了日日新大型模型体系,5月科大讯飞发布了星火大型模型等。目前我国已经拥有上百个大型语言模型。据中国信息通信研究院的测算,2022年我国的计算设备总算力中,基础算力占40%的比例,而智能算力比例高达59%,成为算力快速增长的主要动力。根据预测,到2026年智能算力规模将达到每秒十万亿亿次浮点计算(ZFlops)的级别。
现如今,随着大型语言模型的发展,AI计算能力需求迅速增加。每隔几个月,消耗的计算资源就会翻倍,这种算力需求的增长速度已经远远超过了芯片性能提升和产能扩张速度的上限限制。”单志广表示。
公共云服务可以缓解计算能力短缺的潜力。
公有云是一种以应用为中心、以需求为导向的公共服务模式。在人工智能时代,公有云将成为解决计算资源短缺、降低计算成本的关键手段。
首先,公共云拥有训练大型模型所需的强大计算能力。要训练世界领先的基础大型模型,需要调度至少数以万计的GPU芯片进行高效协同工作,只有极少数公共云具备这样的能力。从亚马逊、微软和谷歌等科技巨头运营公共云的经验来看,它们的优势在于规模大、效率高,因此天然具备向全球市场扩张的能力。
其次,公共云的规模效应能普及计算能力。随着人工智能大型模型的广泛应用,支持海量用户频繁访问所需的推理计算成本也会急剧增加,特别是多模态大型模型对计算资源的消耗高于文本类大型语言模型。计算成本是制约大型模型发展的关键因素之一,中小型人工智能企业通常难以自行解决培训和推理所需计算资源,因此需求更多地转向租赁计算能力。公共云可以进行资源共享,通过多租户共享同一套计算资源池,平衡资源利用,降低成本。例如亚马逊、阿里云等公共云供应商随着用户规模增长、技术优化和运营效率提升,不断降低云计算服务价格,亚马逊AWS曾每年连续降价12次;过去十年,阿里云将计算成本降低了80%,存储成本降低了近90%。
此外,公共云能够突破我国算力供给能力的边界。公共云采用集群计算、网络、存储平衡设计和软硬件一体化加速技术,调度现有芯片,形成大规模算力资源池,实现芯片复用和灵活可扩展;充分发挥公共云大规模机器调度和异构芯片兼容能力,不仅可高效利用先进芯片资源,还能充分利用通用CPU资源,提供AI大型模型训练和推理应用所需的算力支持;随着公共云技术体系的加速升级,AI训练、AI推理和HPC超级计算等资源将集中管理,推动算力的普及和模型的推广。
参与者在2023年10月31日在杭州举办的云栖大会上了解了云计算产品和应用。这是黄宗治摄影的。
促进云端计算向智能化发展。
公共云与人工智能的融合将推动云计算进入智能化时代。未来的云计算将不仅限于IT计算本身,而是提供全面创新服务,包括算力、模型、数据、生态等与智能发展相关的方方面面,推动人工智能与云计算相结合,引领新一代生产力的发展。
促进云计算向智能化方向发展,急需解决技术层面的不足。国家信息中心的信息化和产业发展部提出了公共云技术服务体系架构解决方案。
首先,要依托融合算力设施建立云计算的基础。利用虚拟化技术将不同硬件资源,例如计算、存储、网络等进行整合,从而提供融合多种异构算力的服务。不论是X86、GPU或者ARM(芯片),都可以在这个平台上运行,不仅可以解决人工智能算力不足的问题,也能推动大规模的商业化进程。
其次,重点建立以AI工程化工具为核心的平台,为开发人员提供统一的研发、测试、运维工具,包括智能计算服务和机器学习框架,以提高AI开发效率。开发人员无需在本地维护复杂平台,即可享受工程化的便利,降低开发成本。
第三点是为开发者提供全方位的模型服务。大型模型是人工智能竞争的关键,通过整合模型聚合、开发以及服务,我们能够突破传统人工智能应用的限制,使得人工智能技术更易于应用于各行各业。
第四点是,以智能化应用场景为亮点,为各种智能化场景提供软件服务。
此外,公共云还需要在大规模集群管理方面进一步加强能力,以提高资源利用效率,以更好地满足人工智能对计算能力的需求。”单志广表示。
 
免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章