跳转到内容

故障排查总览

任何系统都会出问题——重要的是快速定位 + 解决。本章给你一套从症状到根因的排查路径。

报告问题
① 重现(能复现吗?)
② 范围(多少用户受影响?)
③ 症状(具体表现是什么?)
④ 假设(可能原因?)
⑤ 验证(看日志 / 测试)
⑥ 修复
⑦ 验证修复
⑧ 复盘(防止再发生)

按问题类型分类:

1. 前台显示问题

页面白屏、样式错乱、内容不更新、加载慢

阅读 →

2. 后台操作问题

登录失败、保存失败、上传失败、按钮无反应

阅读 →

3. 邮件 / 通知问题

询盘邮件没到、通知延迟、CRM 未同步

阅读 →

4. 多语言 / SEO 问题

翻译丢失、URL 错误、Google 不收录

阅读 →

5. 性能问题

站点慢、数据库慢、CPU 高

阅读 →

  • 复现一次:自己在浏览器试一遍
  • 多设备:手机 / 桌面、不同浏览器
  • 多用户:让另一个人也试

如果不能复现,可能是用户那边的问题(缓存、网络、设备)。

详细描述:

  • 报的(用户名 / 邮箱)
  • 什么时候发生
  • 怎么操作触发
  • 看到什么错误
  • 截图 / 录屏
  • 浏览器 / 设备

→ 信息越详细越好排查。

发现问题先别动手改——先:

  • 确认问题
  • 找根因
  • 评估改动影响

乱改的代价

  • 可能破坏其他功能
  • 让原问题更难找
  • 增加事后回滚成本

日志是排查最有力的工具:

  • 后端日志:让运维查看
  • 前端日志:浏览器 F12 → Console
  • 操作日志:BangNiCMS 后台「用户管理 → 操作日志」

不知道哪一步出错时——逐步缩小范围

现象:保存产品失败
问题在哪?
├─ 浏览器问题?换浏览器试 → 还失败
├─ 网络问题?看 F12 → Network → 200
├─ 表单数据问题?看请求 body → 正常
├─ 后端问题?看运维日志 → 数据库连接失败
└─ 数据库问题?让运维查 → 是

排查时人容易自我确认偏误

  • “我觉得是 X 问题” → 找 X 证据 → 找到 → 修 X
  • 但真实原因可能是 Y → 修 X 没用

保持怀疑 + 看数据 / 看日志

某些症状看起来是 bug,实际不是:

症状实际原因
”我改了内容前台没变”浏览器缓存 → 硬刷新
”我登录不上”密码错 / 大小写 / Caps Lock
”图片显示不出来”网络慢 / CDN 节点问题
”提交后白屏”用户网络断了
”AI 没响应”中国大陆访问海外 API 慢
”搜索结果不准”SEO 索引未更新(要等几天)

遇到症状先排除假阳性——再查真 bug。

紧急(立刻处理):

  • 整站不可访问
  • 数据库连接失败
  • 大量用户报错
  • 安全事件(被入侵)
  • 数据丢失

非紧急(按优先级排):

  • 部分功能异常
  • 个别用户问题
  • 性能下降但仍可用
  • 视觉小瑕疵

紧急情况临时止损(如切换主题、回滚版本),再慢慢查根因。

升级失败的特殊处理详见:

被入侵 / 数据泄漏:

工具用途
浏览器 F12前端调试
Lighthouse性能 / SEO 审计
PageSpeed InsightsCore Web Vitals
Search ConsoleSEO 问题
GA 实时报告流量异常
后端日志后端错误
数据库慢查询日志性能瓶颈
APM 工具(New Relic / 阿里云 ARMS)全链路监控
  • 怀疑系统 bug(在所有版本都可复现)
  • 安全漏洞
  • 升级失败需要数据迁移帮助
  • 严重数据问题

报告 bug 时提供

  • BangNiCMS 版本号
  • 重现步骤
  • 期望行为 vs 实际行为
  • 浏览器 / 操作系统
  • 截图 / 日志

前台显示问题 →