数据中心的存在是为了确保计算的安全性和连续性。然而,仅在过去三年内,就发生了十几起数据中心故障和灾难。数据中心系统复杂且难以安全运行。近期的极端天气和技术发展也给数据中心的高可靠性带来了新的挑战。我们应该如何预防和应对?
数据中心故障“老面孔”
不难发现,电力系统、制冷系统和人工操作是导致数据中心故障的最常见因素。
接线老化
电线老化引起火灾,常见于旧数据中心,韩国SK数据中心火灾就是由于电线起火造成的。线路故障的主要原因是“老+热”。
老旧:电线绝缘层正常使用寿命为10~20年。一旦老化,可能会造成损坏,绝缘性能下降。当遇到液体或湿度较高时,很容易引起短路和火灾。
辣度:根据焦耳定律,负载电流通过电线时会产生热量。数据中心24小时运行,电力电缆长期高负荷运行,高温会加速电缆绝缘老化,甚至击穿。
UPS/电池故障
英国Telstra数据中心火灾和北京邮电大学数据中心火灾都是由电池故障引起的。
数据中心电池/UPS故障的主要原因是过度循环放电、连接松动、高温、高浮充电压/低浮充电压等。铅酸电池的寿命一般为5年,锂离子电池的寿命在10年左右,随着电池寿命的增加,其性能下降,故障率也增加。维护和检查的疏忽可能会因不及时更换过期电池而导致严重后果。
并且由于数据中心电池数量众多,串并联使用,一旦电池故障引起火灾、爆炸,就会蔓延造成重大灾难。锂电池爆炸的风险比铅酸电池更高,灭火也会更加困难。例如,2021年北京丰台区西红门储能电站爆炸事故,就是由于磷酸铁锂电池内部短路故障,导致电池热失效起火蔓延,进而引发火灾。遇到电火花就会爆炸。这是近年来锂离子电池应用中备受关注的主要来源。
制冷故障
无论是压缩机、安全阀还是停水引起的制冷故障或制冷效率低,都会引起室温升高,影响设备性能,如不及时处理,室温继续升高,或因过热中断,会导致服务中断、硬件损坏和数据丢失。
Newsunn为数据中心的PDU提供了安全的解决方案,具有各种类型的功能模块。立即联系我们并定制您自己的数据中心 PDU。我们有C13 可锁定 PDU, 机架式电涌保护器 PDU,具有总计量功能的三相 IEC 和 Schuko PDU, ETC。
发布时间:2023年4月6日