时刻

微软和Meta加入谷歌,利用人工智能帮助运行其数据中心

微软和Meta加入谷歌,利用人工智能帮助运行其数据中心

数据中心驱动着数十亿人每天使用的应用程序、网站和服务,对于建造和维护它们的工人来说,可能是一个危险的地方。工人们有时不得不在数据中心的电气设备通电时为其提供服务。他们可能会接触到氯气等化学品,氯气被用作计算机和服务器的液体冷却系统中循环水的消毒剂。2015年6月,北卡罗来纳州梅登的一个苹果数据中心发生氯气泄漏,5人不得不被送往医院。

数据中心比以前更安全了。但为了寻求前瞻性的解决方案,一些科技巨头表示,他们正在探索如何应用人工智能来预防安全问题。例如,微软正在开发一个人工智能系统,分析一系列来源的数据,并为数据中心建设和运营团队生成警报,以 “防止或减轻安全事故的影响”。一个补充但相关的系统也在开发中,试图检测和预测对数据中心建设进度的影响。

“这些举措都处于早期测试阶段,预计今年晚些时候将开始扩展到我们的生产环境中。

Meta公司还声称正在研究人工智能如何预测其数据中心在可能导致不安全工作环境的 “极端环境条件 “下的运作方式。该公司表示,它一直在开发物理模型来模拟极端条件,并将这些数据引入负责优化整个服务器功耗、冷却和气流的人工智能模型。

来自数据中心的大量运营数据,在一些地区,在服务器、机架和数据大厅的内置传感器的频率很高,每台服务器和网络设备,承担不同的工作负载,将消耗不同数量的电力,产生不同数量的热量,并使数据中心内的空气流通量不同。我们的[基础设施]团队收集每台服务器的所有数据,然后开发人工智能模型,可以在数据中心分配我们的服务器和机架,并将工作负载发送到这些服务器,以优化性能和效率。

当然,除了安全之外,公司还有动机来确保数据中心保持在最佳状态。停机是昂贵的–而且越来越频繁。根据IT咨询公司IT正常运行时间研究所2020年的一项调查,三分之一的数据中心所有者和运营商承认在过去的12个月中经历了一次重大故障。六分之一的人声称,他们的故障给他们带来了超过100万美元的损失–比2019年的十分之一要高。

Meta公司在全球有20多个数据中心在运行,包括在德克萨斯州和密苏里州的新项目,估计总成本为16亿美元。与此同时,微软管理着200多个数据中心,并表示在可预见的未来,它将每年建设50至100个新的数据中心。

人工智能还有望在数据中心找到通常不为人知的能源–也就是成本–节约的机会,这是对企业有吸引力的另一个方面。2018年,谷歌声称,由其DeepMind附属公司开发的人工智能系统能够比其数据中心的历史能源使用量平均节省30%的能源。
当接触到评论时,DeepMind表示,除了最初的公告外,它没有任何更新的信息可以分享。IBM和亚马逊没有对询问作出回应。但Meta和微软都表示,他们现在正在使用人工智能来实现类似的能源调整目的。

微软在2021年底推出了人工智能 “异常检测方法”,利用电气和机械设备的遥测数据,衡量和缓解数据中心内的异常用电和用水事件。该公司还在使用基于人工智能的方法来识别和修复数据中心内电表的问题,并确定放置服务器的理想位置,以尽量减少电力、网络和冷却能力的浪费。

Meta公司则表示,它一直在利用强化学习来减少它为冷却目的而泵入数据中心的空气量。(在高层次上,强化学习是一种人工智能系统,通过试验和错误来学习解决问题)。该公司的大多数数据中心使用室外空气和蒸发冷却系统,使优化气流成为一个高度优先事项。

减少环境足迹是能源调节人工智能系统的一个额外好处。根据环境调查机构的一份报告,数据中心消耗了全球电力需求的约1%,并在2020年贡献了所有二氧化碳排放量的0.3%。而典型的数据中心每天使用300万至500万加仑的水,与一个拥有3万至5万人口的城市的用水量相同。

微软此前曾表示,它计划在2025年前让其所有的数据中心100%使用可再生能源运行。Meta公司声称在2020年实现了这一壮举

分享此文章