华为服务器 iBMC与Dump分析

本文档为华为服务器通用知识,适用于所有华为机型。

iBMC管理

访问方式

  • Web界面:https://<iBMC_IP>(默认端口443)
  • SSH:ssh Administrator@<iBMC_IP>
  • SNMP:用于监控告警

常用操作

  • 查看硬件健康状态:主页 → 健康摘要
  • 查看系统事件日志:诊断 → 系统日志
  • 导出Dump日志:诊断 → 一键收集 → 导出

默认账号

  • 用户名:Administrator
  • 密码:机器标签或设备初始密码(首次登录强制修改)

Dump日志分析

Dump文件类型

文件类型说明
.dmp内核Dump,系统崩溃时自动生成
sysinfo.tar.gz系统信息包,含硬件状态/日志
blackbox.tar.gz黑匣子日志,含故障前后事件

分析工具

  • FDMDecoder:华为官方Dump解码工具,参见 fdmdecoder-usage
  • WorkBuddy iBMC Skill:AI辅助自动分析dump日志

关键日志位置(Linux OS)

/var/log/messages          # 系统日志
/var/crash/                # crash dump目录
/proc/sys/kernel/core_pattern  # core dump路径配置

常见故障代码

错误码含义处理建议
MCE内存/CPU硬件错误更换问题DIMM或CPU
CE可纠正错误监控,超阈值更换
UE不可纠正错误立即更换硬件
PCIE AERPCIe链路错误检查HBA/网卡

相关链接