人工智能可以帮助数据中心更高效地运行

2020-04-13 16:15:06
导读最近小茹姐发现人工智能可以帮助数据中心更高效地运行这个话题相信很多小伙伴们都很感兴趣吧,那么今天就带大家了解下人工智能可以帮助数据

最近小茹姐发现人工智能可以帮助数据中心更高效地运行这个话题相信很多小伙伴们都很感兴趣吧,那么今天就带大家了解下人工智能可以帮助数据中心更高效地运行的具体详情,那么小茹姐就来给大家说说具体的一些问题吧,希望对大家有所帮助。

麻省理工学院的研究人员开发的新型系统可以自动“学习”如何在数千台服务器上调度数据处理操作,而这通常是由不精确的人工设计算法完成的任务。这样做可以帮助当今耗电的数据中心更加高效地运行。

数据中心可以包含数以万计的服务器,这些服务器不断运行来自开发人员和用户的数据处理任务。群集调度算法可实时跨服务器分配传入任务,以有效利用所有可用的计算资源并快速完成工作。

但是,传统上,人们会根据一些基本准则(“策略”)和各种折衷来微调那些调度算法。例如,他们可以对算法进行编码,以快速完成某些作业,或者在作业之间平均分配资源。但是工作负载(意味着组合任务的组)各种各样。因此,人类几乎不可能针对特定的工作负载优化其调度算法,因此,他们常常无法发挥其真正的效率潜力。

麻省理工学院的研究人员将所有手动编码转移到了机器上。在SIGCOMM上发表的一篇论文中,他们描述了一种利用“强化学习”(RL)(一种反复试验的机器学习技术)来针对特定服务器群集中特定工作负载量身定制调度决策的系统。

为此,他们建立了新颖的RL技术,可以对复杂的工作量进行训练。在培训中,系统尝试了多种可能的方式来跨服务器分配传入的工作负载,最终在利用计算资源和快速处理速度方面找到了最佳折衷方案。除了“减少工作完成时间”这样的简单指令,不需要人工干预。

与最佳的手写调度算法相比,研究人员的系统完成工作的速度提高了大约20%到30%,而在交通繁忙时则完成速度提高了一倍。但是,大多数情况下,系统会学习如何有效压缩工作负载而几乎没有浪费。结果表明,该系统可以使数据中心使用更少的资源,以更高的速度处理相同的工作负载。

电气工程和计算机科学系的博士生Hongzi Mao说:“如果您有使用机器进行反复试验的方法,他们可以尝试以不同的方式安排作业,并自动找出哪种策略比其他方法更好。” (EECS)。“这可以自动提高系统性能。利用率的任何微小提高,即使提高1%,都可以节省数百万美元,并为数据中心节省大量能源。”

EECS教授和计算机科学与人工智能实验室(CSAIL)的研究员穆罕默德·阿里扎德(Mohammad Alizadeh)补充说:“制定调度决策没有万能的选择。” “在现有系统中,这些是您必须预先决定的硬编码参数。相反,我们的系统将根据数据中心和工作负载学习调整其调度策略特征。”

通常,数据处理作业进入数据中心,以“节点”和“边缘”的图形表示。每个节点代表一些需要完成的计算任务,其中节点越大,所需的计算能力越强。连接节点的边缘将连接的任务链接在一起。调度算法根据各种策略将节点分配给服务器。

但是传统的RL系统并不习惯于处理这样的动态图。这些系统使用软件“代理”进行决策并接收反馈信号作为奖励。从本质上讲,它会尝试在给定的上下文中学习任何理想行为,从而最大化其对任何给定动作的回报。例如,它们可以帮助机器人学习如何执行与通过与环境交互来拾取物体等任务,但这涉及通过更容易设置的像素网格处理视频或图像。

为了构建他们的基于RL的调度程序Decima,研究人员必须开发一种模型,该模型可以处理图形结构的作业,并可以扩展到大量作业和服务器。他们系统的“代理”是一种调度算法,该算法利用了图神经网络,通常用于处理图结构数据。为了提出适合计划的图神经网络,他们实现了一个自定义组件,该组件聚集了跨图路径的信息-例如快速估计完成图的给定部分需要多少计算。这对于作业调度很重要,因为“子”(下)节点要等到其“父”(上)节点完成后才能开始执行,因此,预测图表中沿不同路径的未来工作对于制定良好的调度决策至关重要。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章