人工智能产业加速,为什么AI算力要先行?

2022-06-29 20:29:26   编辑:小美
导读毫无疑问,如今AI与产业的结合越来越紧密。从自动驾驶,到智慧医疗、智慧金融、智慧城市等。

毫无疑问,如今AI与产业的结合越来越紧密。从自动驾驶,到智慧医疗、智慧金融、智慧城市等。,AI已经开始渗透到我们生活的方方面面。事实上,即使传统行业用户对AI转型的需求还没有完全激活,这部分刚刚浮出水面的需求已经是万亿元的超市规模。

与此同时,AI的应用也扩展到了一个人们以前从未想到过的地方——那就是边缘端。IDC预测,未来五年全球边缘计算服务器市场年复合增长率为20.2%;在中国市场,边缘计算服务器市场未来五年的年复合增长率高达76.7%。

这也意味着,随着AI行业应用的不断深入,参数空间会更大,结构会更复杂,计算功耗更高的大型AI模型会不断涌现。同时,由于大部分数据仍然需要在网络边缘进行分析、处理和存储,当连接数量不断增加时,所需的边缘AI计算能力将呈指数级增长。

那么,如何才能更好地解决行业AI和边缘AI爆发带来的这种挑战呢?换句话说,当“边缘”遇上“AI”,如何才能更好地跨越背后的计算能力“鸿沟”?

当边缘遇上AI,背后的双重挑战

可见,人工智能的变革力量和能力,提高了企业经营的便利性和企业的投资回报率。然而,随着企业数据的空前增长和膨胀,以及复杂多变的系统中以各种方式流动的工作负载,这不仅加剧了企业和行业利用AI的能力,也因其位置的复杂性而增加了边缘AI的重要性,使企业面临全新的挑战。我们可以从两个维度进行观察:

一方面,从行业AI的角度来看,AI技术正在加速与各大行业的融合,创造更多的行业应用场景。但与此同时,AI在这些行业的应用也增加了对计算能力的消耗。数据显示,目前的AI计算能力平均2-3个月就会翻倍,AI模型越来越大,模型的参数规模也在快速增长。因此,对于AI的计算和训练,不仅需要引入多样化的计算方法,而且对于AI的大规模训练,仅仅通过提高AI来加速单芯片卡的性能是非常困难的。这也使得多机多卡分布式训练“势在必行”。但相对于通常采用单机训练的AI服务器,多机GPU分布式训练是一个系统工程,需要打破“通信墙”和“IO墙”的约束。

另一方面,从edge AI的角度来看,edge AI的兴起也带来了云边缘的协同挑战。在这个过程中,随着应用创新的加速和应用的种类和数量,将使得传统的数据中心基础设施越来越难以满足行业边缘应用场景的需求,如计算能力、实时业务、数据安全和隐私等需求。,再加上对边缘运行环境的苛刻要求,整个边缘计算市场将面临巨大的机遇和更加严峻的挑战。

可见,AI的快速发展,不仅会推动AI在行业内的广泛应用,也会让来自边缘的数据快速增长。在这个过程中,最重要的AI计算资源不仅需要由传统的数据中心承担,还需要在边缘进行预处理或初步处理。这些新应用和新场景将使AI计算需求进入一个新时代。

行业加速,如何释放AI算力

事实上,作为这场AI产业热潮的主要技术驱动力,深度学习对计算能力的要求远高于经典的机器学习算法。在这种背景下,如果企业在应用AI时仍然采用简单粗放的方式,在一台服务器上插尽可能多的GPU卡来搭建AI计算平台,显然难以化解AI计算能力增长的挑战。因此,戴尔科技认为,新一代AI计算平台的建设将向“多元化、集群化、精细化”的方向发展。

第一,多元化方面,主要是指需要推出更多元化的AI加速芯片技术。可以看到,目前头部AI用户已经在寻找更高性能或更具性价比的AI加速芯片技术,包括更多品牌的GPU和专门为AI深度学习设计的AI神经网络专用加速芯片(NPU)。

在这方面,戴尔科技为行业用户打造了一套端到端的AI基础设施硬件解决方案,包括各种类型的AI加速服务器,通过采用GPU/FPGA/CPU/AI专用加速芯片IPU等满足用户的多样化需求此外,在AI软件平台领域,戴尔科技还提供基础设施硬件和AI框架软件及学习库的适配和优化,提供AI计算集群集中管理和资源调度分配的软件解决方案;同时,针对当前AI计算的热点技术,如GPU虚拟化、GPU分布式训练等,戴尔也提供了针对性的解决方案。

第二,在集群化方面,针对AI计算集群和多机多卡分布式训练,戴尔科技还为行业用户提供包括计算、存储、网络、框架软件优化在内的整体解决方案。同时,戴尔技术AI GPU分布式训练白皮书已经发布,为用户搭建AI计算集群和多机多卡分布式训练提供更多参考价值。

此外,Dell PowerEdge服务器系列还提供了许多专为GPU计算而设计和优化的服务器,包括PowerEdge R750xa和PowerEdge XE8545,其中PowerEdge R750xa可以为要求苛刻的新兴工作负载和GPU密集型工作负载提供出色的性能。可以支持更多的GPU选择,支持NVLink桥技术,实现GPU之间的高速两两通信。而PowerEdge XE8545是一款4U机架式GPU加速服务器,完全互联四个A100Pear-to-Pear NV链路,其AI模型训练计算性能提升5%-15%。

测试数据显示,戴尔技术通过6个PowerEdge XE8545和24个A100 GPU计算集群,运行主流图像分类模型的分布式GPU训练,实现了88%-96%的线性加速比。2021年下半年,在业界最受关注的AI性能基准测试MLPerf中,戴尔科技在MLPerf Training v1.1的基准测试中,通过使用2台8卡A100套和4台16卡A100套运行图像分类的基准测试,提交了基于PowerEdge R750xa的分布式训练测试数据,与单个R750xa相比,也分别取得了1.96倍和3.63倍的加速效果。

第三,在细化方面,能否“切割”GPU的计算能力,共享更多应用的计算能力的GPU虚拟化技术,也是很多行业用户提出的搭建AI计算平台的新需求。

基于此,2021年,戴尔科技联合英伟达和Vmware推出了AI GPU虚拟化平台解决方案NVIDIA AI Enterprise(NVAIE),并在Vmware虚拟化和云元平台上部署了NVIDIA AI和数据分析软件套件。项目中的测试数据还显示,在PowerEdge R750xa和A100 GPU硬件设备上,NVIDIA AI Enterprise对GPU计算能力的“切割”可以实现几乎等同于裸机的AI计算速度,也使该用户平台的在线人数增加了数倍。

不难看出,针对行业AI落地中“多样化、集群化、精细化”的需求,戴尔科技打造了一系列端到端的解决方案,同时在产品方面不断“创新求变”,不仅最大限度地满足了行业用户对AI算力的需求,也加速了行业AI应用的落地进程。

从创新到实践,推动边缘AI落地

如上所述,edge AI也成为了新的发展趋势。同样,越来越多的企业意识到,AI计算资源不仅需要由传统数据中心承担,还需要在边缘进行预处理或初步处理。这些新的应用和新的场景将使整个边缘计算面临新的挑战。因此,如何快速、简单、有效地部署它,然后在不牺牲业务及其客户的性能和可用性的情况下,安全、高效地运行它,已经成为当前edge AI落地的重要任务。

针对这些需求,戴尔科技还推出了适用于AI边缘计算场景的边缘优化服务器PowerEdge XR11和PowerEdge XR12。同时积极深入行业应用场景,利用人工智能技术和边缘/核心计算解决方案,在边缘AI领域进行了一系列探索和实践。

在此基础上,戴尔科技还打造了edge AI智能创新解决方案——Edge-in-a-box一体化交付解决方案,实现了edge IT与数据中心基础设施的融合;可以最小化延迟;并能实时处理相关数据;支持集成基础设施部署;它具有远程操作和维护的能力,并能确保100%的正常运行时间。edge AI的这一智能创新解决方案还具有三大优势:可以通过标准化设计简化采购和部署流程,预先设计的模块化智能解决方案降低了“系统启动”的成本和时间;通过将电力、制冷和管理的综合能力与业内最佳服务相结合,我们可以为客户提供高性能、高可用性和高效的能源;更重要的是,通过整合IT和数据中心基础设施,我们可以帮助更多的客户快速满足为其业务和客户提供服务的需求。

在推动edge AI落地方面,戴尔科技还与国家赛艇和皮划艇队合作,以新一代实时计算能力为赛艇动作的实时捕捉和生物力学分析提供支持。由于国家赛艇和皮划艇队的成员经常前往不同国家和城市的不同训练基地,同时在每个基地训练数周或数月,因此这期间的挑战相当巨大。如果不能指望训练场有高速稳定的网络连接,部署的边缘服务器将面临基地潮湿环境的挑战。

因此,戴尔科技提供的edge AI智能创新解决方案,通过视频实时捕捉国家队运动员的训练动作,并进行实时分析判断,从而纠正运动训练中动作角度、力量、稳定性的偏差,帮助赛艇运动员提高训练竞技水平。

值得一提的是,中国的许多“智能港口”还配备了戴尔创造的智能龙门起重机系统。采用AI技术,通过多路视频和PLC状态信息,集成了防打保龄球、防吊装、大车自动纠偏、大车防撞、集装箱智能定位、集装箱信息识别、底部扭锁识别、区域安全管理八大功能。这样,通过“一个大脑,一套传感器”

总的来说,在边缘AI解决方案方面,戴尔科技已经能够为客户提供从边缘应用、数据采集、边缘计算与分析、实时分析、数据维护到人工智能深度学习的端到端解决方案,打造跨边缘、核心和云的最完整解决方案组合,支持开放生态系统中的各种边缘工作负载。

数据的爆炸式增长,给企业使用人工智能应用带来了更大的挑战,但也给整个市场带来了前所未有的机遇。在这一过程中,戴尔科技集团始终保持不断的投入和创新、进化和迭代,不仅在数据中心提供“多元化、集群化和精细化”的AI计算解决方案,支持人工智能在企业中的应用;同时,在边缘端,也提供了新一代的实时边缘计算能力,打造边缘AI的智能创新方案,驱动企业走向边缘AI时代。可以说,它为AI真正走向千万行业奠定了关键基础,其价值“不仅是现在,更是未来。”

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章