人工智能是数据中心基础设施管理的必然趋势

人工智能是数据中心基础设施管理的必然趋势 维护数据中心是一项复杂的任务。那些一直参与维持基础设施运转,同时试图减少运营费用的人知道我们在说什么 当您拥有无限的资源时,维护正常运行时间是很容易的。只要将其设置为3N+1或更高,那么发生故障的几率将接近于零。 然而,没有人能负担得起这样的开支。不是为了投资,也不是为了维持所有设备运行的运营成本。 那么,您的数据中心正常运行时间面临的最大风险是什么?您的员工 阅读更多 → 确保您的数据中心有防火保护…阅读更多 → 寻找最有效点 数据中心的运营管理人员有一个复杂的任务,那就是找到资本支出和运营支出之和满足正常运行时间的最有效点。如何以最小的投资和最低的运营成本实现最大的正常运行时间呢?有时正常运行时间是固定的,比如99995%,成本应该由此产生。在其他情况下,需要找到给定成本下的最大正常运行时间。在任何情况下,管理人员的操作都是着眼于一个非常复杂的选项领域,其中每个决策都会影响其他变量。这有点像下棋,您需要着眼于未来 人工智能一次又一次地打败人类 1996年,IBM公司开发的一台名叫“深蓝”的计算机与国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)展开了一场较量,深蓝最终以3.5比2.5的成绩赢得了比赛。2017年,人工智能“阿尔法围棋”击败了当时的世界冠军柯洁,赢得了围棋比赛中的全部3局,围棋比国际象棋复杂得多。人工智能(AI)已经一次又一次地被证明比人类在战略决策方面做得更好。因此,显而易见的是,人工智能将在数据中心非常复杂的决策中发挥重要作用。 运行一个数据中心会有多复杂? 一个数据中心有很多相互关联的变量。其中就包括服务器层面的空气温度、CRAC入口和出口的温度、空速、各种基础设施设备的效率水平。然后是服务器的时间可靠的能量需求。一些在夜间达到高峰,而另一些在办公时间更为活跃。 当您在处理所有这些参数时,您需要同时考虑所有机械设备的冗余性,以便单个故障不会导致停机。在满足以上情况的同时,您还必须注意维护所有的硬件,并在维护期间兼顾到冗余性,对了,您还需要在花费尽可能少的精力的情况下完成所有这些 明白了吗?这对人类来说几乎是一项不可能完成的任务。机器做数学运算的速度几乎要比人类快无限倍。 这仅仅是计算的问题吗? 不,因为计算机做数学运算只是计算输入代码的内容。它不能独立思考。深度学习使计算机能够分析大量数据并从中得出结论。但即使这样也有其局限性:以前从未发生过的情况如何处理?您如何预测您还没有测试过的东西?这就引申出了“数字孪生”的概念。Perf-iT在其最新版本的4D Cool中使用了这项技术,这是数据中心效率管理的一个全新概念。 数字孪生与‘假设’4D Cool是一款基于现实生活数据的管理系统,这些数据借助数量有限的传感器以及计算流体力学(CFD)生成,其可以预测数据室每个角落的温度,以及数据中心的完全数字化版本。通过分析计算流体力学的输出以及来自传感器的真实数据,系统可以不断改进其预测。当可预测性水平足够高时,它就可以分析假设性的情况,例如:假设我们的变压器坏了,或者假设我们在这条通道上再放500台服务器。这些“假设性场景”只能通过数字孪生这一概念来计算,因为数字孪生是您真实生活数据中心的精确表示。 数据中心的未来是数字化的 数据中心的规模和复杂性在不断提高。一个人不可能做到同时处理这么多变量,并预测多个变量变化的影响。这时候就需要计算机介入。但是单靠数字运算并不能达到目的。计算机需要通过与真实数据的交叉核对来验证自己的计算结果。而数字孪生正好就是负责处理这个的。DC管理人员现在有了这样一个工具,可以用它来分析数据中心变化所带来的影响,从而确定最佳行动方案。4D Cool就是那个工具,我们很乐意为您演示 [...]

人工智能是数据中心基础设施管理的必然趋势2021-03-24T10:24:51+00:00

确保您的数据中心有防火保护…

确保您的数据中心有防火保护… 但是您如何防范网络攻击呢? 所有(相对近期的)数据中心都在建筑的设计中加入了防火措施。基于非常昂贵的惰性气体的早期预警系统和自动灭火系统可确保任何火灾都能被注意到并尽快得到处理。 然而,与受到网络罪犯攻击的风险相比,遭受火灾的风险是微乎其微的。您可能会说,数据中心遭受火灾的成本比网络攻击要高。那么,再好好想想。 人工智能是数据中心基础设施管理的必然趋势 阅读更多 → 那么,您的数据中心正常运行时间面临的最大风险是什么?您的员工 阅读更多→ 火灾vs勒索软件 为了说明这一点,您可以简单地谷歌搜索一下“数据中心和火灾”并过滤过去一年的结果。很少会搜索到匹配记录。但是如果您谷歌搜索“数据中心和勒索软件”,您会惊讶地发现有无数的数据中心曾经遭受过它的攻击。 单是勒索软件的攻击就可能让您损失惨重。这些攻击者向受害者索要4200万美元(可以在ZDnet阅读完整详情)。但威胁您公司未来的不仅仅是勒索软件。您可以想想修复您所有的计算机设备和/或基础设施设备所花费的成本,以及在修复过程中您不能使用这些设备而为您带来的损失。往往大多数数据中心都无法从这样的事件中恢复过来。 问题的症结是什么? 有许多网络罪犯以入侵计算机网络为生。他们追踪的不仅仅是敏感数据。他们也对获得工业控制系统的控制权很感兴趣。当机场控制系统、水管理系统、交通控制系统或数据中心被犯罪分子停用或控制时,风险非常高。一旦他们掌握了控制权,您会付多少钱来阻止他们这么做? 当然,防止这种情况发生的成本,或者至少是将这种情况发生的风险降到最低的成本,要远远低于您的网络遭受攻击后要支付的金额。 数据中心网络安全方面经验丰富 自2007年以来,我们一直在积极监测和保护数据中心基础设施。通过开发能够控制数据中心的软件,我们对工业控制系统有了全面的了解。我们就客户如何按照ISA/IEC 62443标准的原则保护他们的基础设施向他们提供了建议。 我们来讨论一下您的数据中心需求。 [...]

确保您的数据中心有防火保护…2021-03-24T09:57:17+00:00

那么,您的数据中心正常运行时间面临的最大风险是什么?您的员工

那么,您的数据中心正常运行时间面临的最大风险是什么?您的员工 据国际正常运行时间协会(Uptime Institute)称,人为错误是停机的主要原因. 国际正常运行时间协会 全年对数千名数据中心专业人员进行了停机调查,他们发现绝大多数数据中心故障(约70%)是由人为错误造成的。在1300名受访者中,近一半的人在过去三年里经历了一次重大或更大的停机。严重类停机的平均成本在每个事件100万美元以上。 例如,前段时间在定期维护期间意外释放了灭火剂,导致Microsoft Azure平台的多项服务自动关闭。这给北欧的客户试图连接到托管服务造成了困难。 人工智能是数据中心基础设施管理的必然趋势 阅读更多 → 确保您的数据中心有防火保护… 阅读更多 → 维护保养困难 这印证了我们的经验,即在维护保养期间经常发生停机。维护保养是人工干预自动化系统的典型情况:需要更换HVAC中的过滤器,或者需要拆除UPS进行检查。在这时,“人为错误”可能会对通常完全自动化的系统产生重大影响。 在这种情况下,可能有人连接了错误的线路或按了错误的按钮,导致系统释放其灭火剂。这导致了一系列的事件,开始于自动关闭空气循环。这是合乎逻辑的,因为系统假定存在火灾导致灭火系统跳闸。冷风自动关闭后,空白区温度突然升高。这导致服务器和存储系统开始进入关闭程序,从而导致一些Azure的服务不可用。 多米诺效应 这是一种典型的多米诺效应,一个相对无害的行为,即释放灭火剂,伴随着一系列自动化响应,最终导致系统关闭。 这就引出了一个难以自动化的因素:人为因素。人为操作仍然是数据中心工作流程中不可或缺的一部分。设备需要安装在机架上,过滤器需要清洗或更换,UPS需要定期维护保养,就像HVAC、发电机等。 数据中心管理人员必须考虑到,人为操作比自动化系统更容易犯错(它们真的会犯错吗?)。存在可以显著降低故障率的程序,如适当的文档编制或详细的工作指令。在一些关键的任务中,至少需要两个人一起工作,互相监督。人们在创造力方面表现得很出色,但他们在重复性任务,比如大多数维护工作,方面却很差。犯错误是人之常情。 预测人为因素 关键是,管理层应该考虑到这一点,并预见到人类可能会犯错的事实。除了拥有正确和详细的工作指令之外,他们还应该使其自动化系统能够应对好人为错误。一个合适的DCIM系统可以应付各种维护情况。如果上述情况下的灭火器在DCIM中处于“维护模式”,则溶剂释放时不会关闭空气循环。多米诺链将会停止,Azure平台的客户也不会注意到这个事件的发生。 根据我们的经验,您的DCIM具有这种智能性是很重要的。维护保养是一项有计划性的事件,应该将其记录到DCIM中,以便在此期间对异常情况的处理与常规操作有所不同 [...]

那么,您的数据中心正常运行时间面临的最大风险是什么?您的员工2021-03-24T09:18:55+00:00

Going Paperless: Implementing Digital Quality in Casting

The Problem with Paper-Based Inspections To understand the benefits of digital quality inspections in casting we need to first look at the paper-based alternative. Most foundries, whether investment casting, sand casting, die casting or permanent mold, perform visual inspections of cast parts throughout the production process. These inspections could take place in Shake-Out, Finishing, FPI, [...]

Going Paperless: Implementing Digital Quality in Casting2019-11-06T13:35:42+00:00

Best practices for Assessing Quality in Assembly

Issues Assessing Quality in Assembly Assembly inspections are complex because many components and sub-assemblies must come together and be installed correctly within a designated TAKT Time. The collection of, and reaction to, critical inspection data needs to be orchestrated in tandem with your assembly process. But, with a paper-based inspection many issues can arise. Missed [...]

Best practices for Assessing Quality in Assembly2019-11-04T09:31:46+00:00

Going Paperless: Implementing Digital Quality for Weld Audits

Assessing Quality in Weld AuditsDefects missed during weld audits are expensive to correct as components may be added after a frame or other substructure has been welded. Adding value to a defective structure simply means added costs to repairs or scrap.As a supplier to an OEM, shipping non conformances on a welded subassembly means an expensive [...]

Going Paperless: Implementing Digital Quality for Weld Audits2019-11-04T09:26:19+00:00

Gartners Market Guide to MES/MOM 2019

It’s always good to step back and read Gartner’s reports on our industry. As industry analysts they have great access to industry leaders and a way of distilling their thoughts into readable documents. Gartner’s magic quadrant is their own invention and in this case is a veritable “state of the industry” at a glance. In [...]

Gartners Market Guide to MES/MOM 20192019-07-29T07:24:47+00:00
Go to Top