当 UPS 不间断电源出现故障时,紧急处置的核心原则是 **“先保负载安全,再控制故障扩散”**,需根据故障是否导致 “无输出”(负载断电)分为两类场景,按 “风险控制→临时供电→故障隔离” 的逻辑快速响应,具体步骤如下:
紧急处置前需先通过UPS 面板信号和负载状态,快速区分故障类型,避免盲目操作:
-
类型 1:完全无输出故障:UPS 无电压输出,后端负载(如服务器、交换机)已断电或无法开机,表现为 “输出灯灭、故障灯亮红、蜂鸣器长鸣”。
-
类型 2:有输出但异常故障:UPS 仍有输出(负载未断电),但存在报警或隐患,表现为 “故障灯闪烁、蜂鸣器间断报警(如电池故障、过载、市电异常)”。
此类故障会直接导致业务中断、数据丢失,需立即启动备用供电,减少损失:
-
若有机房备用发电机:立即启动发电机(柴油发电机启动需 5-10 分钟,期间负载无电,需尽快完成),待发电机电压稳定后,将核心负载(如数据库服务器、核心交换机)临时切换至发电机供电(需确认发电机输出电压与负载匹配)。
-
若无发电机:优先关闭所有非核心负载(如测试服务器、冗余存储、办公设备),仅保留核心业务负载,减少电力需求;同时联系电力公司确认市电是否中断(若市电正常,可能是 UPS 输入故障,可尝试后续步骤)。
-
已断电负载:若核心负载(如数据库服务器)已断电,重启后优先执行:
-
验证数据完整性:检查数据库(如 MySQL、Oracle)是否因突然断电损坏,执行数据校验(如 innodb_checksum);
-
检查硬件状态:查看服务器硬盘、存储 RAID 阵列是否降级,若降级需标记并后续重建;
-
恢复业务链路:重启网络设备(交换机、路由器),确认核心业务(如网站、系统)可正常访问。
-
未完全断电负载:若部分负载因 UPS 切换间隙短暂断电,重启后优先恢复关键服务,避免业务长时间中断。
-
断开故障 UPS 的输入市电开关和输出负载开关,避免故障 UPS 接入电网导致短路,或后续市电恢复时冲击设备;
-
若需临时转移负载,用电缆将核心负载直接接入 “稳定市电”(需确认市电电压正常,可通过万用表测量)或发电机,确保负载持续供电。
此类故障(如过载、电池故障、逆变器报警)虽未立即断电,但存在 “后续停机” 或 “损伤负载” 风险,需先控制隐患:
通过 UPS 面板 LCD 屏或指示灯,确认报警类型,针对性操作:
-
过载报警(过载灯亮、长鸣):立即关闭非核心负载(如临时办公电脑、冗余设备),用钳形电流表测量总负载电流,确保≤UPS 额定电流的 80%,观察报警是否解除;若未解除,可能是 UPS 内部短路,需后续隔离。
-
电池故障报警(电池灯闪、黄 / 红灯亮):确认市电是否正常,若市电稳定,UPS 可暂时依赖市电供电,断开电池组开关(避免故障电池拖累主机),后续更换电池。
-
逆变器故障报警(逆变器灯灭、故障灯亮):若 UPS 支持手动旁路功能(查看面板 “旁路灯”),可按说明书步骤切换至旁路(市电直接供电),避免逆变器故障导致输出异常损伤负载;切换前需确认市电电压稳定。
-
市电异常报警(输入灯闪、间断鸣):若 UPS 切换至电池供电,检查市电输入线路(如输入空开是否跳闸、接线是否松动),重新紧固后观察报警是否解除;若仍异常,联系电力公司修复市电。
-
用万用表测量 UPS 输出电压(单相 220V±5%、三相 380V±5%),确认输出稳定,避免电压波动损伤负载;
-
持续观察 UPS 报警状态,若报警加剧(如从间断鸣变为长鸣),立即执行 “场景一” 的隔离步骤,断开故障 UPS,转移负载。
-
记录 UPS 故障时的关键信息:报警代码、指示灯状态、故障发生时间、负载类型,为后续维修提供依据;
-
若故障无法自行缓解(如逆变器故障、控制板报警),立即联系 UPS 厂商售后,说明故障现象,请求紧急上门维修。
-
禁止带电操作危险动作:非专业人员严禁打开 UPS 机壳(内部有高压电容,断电后仍存高压),切换电源、插拔线缆前需确认对应开关已断开,避免触电。
-
核心负载优先原则:应急处置中需优先保障 “数据存储设备(如服务器、存储阵列)” 和 “业务核心设备(如核心交换机、数据库服务器)”,非核心负载可暂时关闭,节省供电资源。
-
避免二次损伤:若怀疑 UPS 输出电压异常(如谐波过大),禁止将精密设备(如医疗仪器、服务器)继续接入故障 UPS,需转移至稳定供电链路。
UPS 故障紧急处置的核心是 “分场景响应,以负载安全为第一目标”:无输出时优先启动备用电源、恢复核心业务;有输出异常时优先隔离风险、稳定输出。整个过程需快速、精准,避免因操作延误导致数据丢失或设备损坏。