AI产业链地图·知识库 预测性运维 · 概念
🚧 网站建设中 更新 2026·06·17 → 产业链图谱
首页/概念/预测性运维
更新 2026·06·17
概念 技术 / 术语

预测性运维

Predictive Maintenance · PdM · 故障预测 · 预测性维护

vs 三种传统模式:

预测性运维 CONCEPT · 概念
首次提出
2010s
关键参与方
[[施耐德电气]] · [[Vertiv]] · [[华为数字能源]]
反向引用
5 处 · 来自 4
归属 DCIMAIOps预测性维护第三层

预测性运维(Predictive Maintenance)

从"事后救火"和"定期保养"升级到"提前预警" — 用 AI 模型分析设备运行参数(振动 / 温度 / 电流 / SMART),在故障发生前 24-72 小时 给出预警,从而提前更换或安排维护窗口。

定义

预测性运维(PdM) = 用机器学习/统计模型对设备健康度做持续评估,预测剩余使用寿命(RUL, Remaining Useful Life) 和故障概率,在故障发生前主动干预。

vs 三种传统模式:

  • 故障维护(Run-to-Failure) — 坏了再修,AI DC 不可接受
  • 预防性维护(Preventive Maintenance) — 按时间周期保养,过度维护或不足
  • 状态监测(Condition Monitoring) — 实时看参数,超阈值告警,被动响应

预测性运维是主动预警 + 提前决策,是 AI DC 的标配能力。

DCIM 场景下的关键预测目标

目标设备 预测信号 预警提前量
硬盘 / SSD SMART 属性、坏块增长 24-72 h
UPS 电池 内阻、温升、充放电曲线 数周-数月
精密空调压缩机 振动频谱、轴承温度、电流谐波 数天-数周
柴油发电机 启动电流、油压、烟温 数次定期测试
PDU / 配电 谐波畸变、接头温升 数天
GPU 卡 显存 ECC 错误、功耗异常 数小时-数天

关键技术栈

  • 特征工程 — 时间窗口、FFT 频谱、统计量、滚动均值
  • 模型 — Random Forest / XGBoost / LSTM / Transformer / 生存分析(Cox / Weibull)
  • 大模型加持 — LLM 生成故障解释 + 处置建议
  • 数字孪生联动3D BIM 数字孪生 中高亮即将故障的设备

主要产品

业务价值

  • 避免非计划停机 — AI DC 单次故障损失 $50K-$1M+
  • 延长设备寿命 — 提前换零部件 vs 整机报废
  • 优化维护成本 — 从 PM 的 "100% 周期保养"降到"按需 30-40%"
  • 保险成本下降 — 部分保险公司开始按 PdM 覆盖率定价

上下游关系

↑ up::AIOps ↓ down::3-10-DCIM数据中心基础设施管理软件 3-03-数据中心 ∈ belongs_to::3-10-DCIM数据中心基础设施管理软件