升级前检查清单
每次升级前逐项核对——5 分钟检查省下 5 小时回滚。
升级前 24 小时
Section titled “升级前 24 小时”- 看新版 changelog / release notes
- 评估变更影响(哪些字段 / 功能变了)
- 通知用户升级时间(提前 12-24h)
- 业务方确认升级不冲突(不在大促 / 重要会议前)
- 运维 + 关键人员当天在岗
升级前 1 小时
Section titled “升级前 1 小时”- 完整数据库备份
- 媒体目录备份
- 备份已上传到云端(不只在本地)
- 备份已校验(大小、文件数正常)
- 测试环境已跑过同一升级
- 测试环境验证通过
- 回滚方案明确(怎么恢复)
- 维护模式页面准备好
- 进入维护模式
- 升级开始时间记录
- 逐步执行(不一次性所有变更)
- 每步校验再下一步
- 监控错误日志
- 服务健康检查通过
- 抽样验证:
- 任一产品 / 文章 / 页面渲染正常
- 多语言切换正常
- 后台登录正常
- 提交一条测试询盘
- 上传一张测试图片
- AI 调用正常
- 退出维护模式
- 通知用户升级完成
- 监控 24-48h:
- 错误率正常
- 性能正常
- 用户反馈
测试环境演练步骤
Section titled “测试环境演练步骤”-
创建测试环境:另一台服务器或同服务器另一端口
-
从生产恢复数据:
- 数据库恢复
- 媒体文件复制(或软链接共享)
- 配置覆盖(用测试环境的密钥)
-
跑升级:按生产流程跑
-
验证:
- 数据完整?
- 功能正常?
- 性能可接受?
- 自定义主题 / 插件兼容?
-
生产升级:测试通过后再上生产
升级失败的应急
Section titled “升级失败的应急”症状清单:
| 症状 | 应急 |
|---|---|
| 服务无法启动 | 立刻回滚 |
| 后台 500 错误 | 看日志 → 决定回滚 / 修 |
| 前台白屏 | 排查主题兼容性 |
| 数据库迁移失败 | 看错误 → 修复或回滚 |
| 部分功能异常 | 评估影响 → 修复或回滚 |
| 性能严重下降 | 排查瓶颈或回滚 |
回滚决策:
- 影响业务关键功能 → 立刻回滚
- 影响小众功能 → 紧急修复,不回滚
- 不确定 → 倾向回滚(保守)
升级通知(提前 24h):
亲爱的用户:
我们将于 4 月 28 日(周日)凌晨 2:00-3:00 进行系统升级,升级内容:- 新功能:XXX- 性能优化- 安全补丁
升级期间前台显示维护页,**预计 30 分钟内**恢复。后台暂时无法访问。
如有疑问,请联系:xxx@example.com
感谢您的理解。邦你科技团队升级完成通知:
系统升级已完成!
新版本 v2.5.0 已上线,更新内容:- ...
如发现任何问题,请立即联系:xxx@example.com升级失败 / 回滚通知:
紧急通知:
由于技术原因,今日凌晨的系统升级已**回滚**到上一版本。站点功能恢复正常。
我们将分析问题,下次升级前充分测试。对您可能造成的不便深表歉意。何时不要升级
Section titled “何时不要升级”- ❌ 备份不完整 / 未验证
- ❌ 测试环境没演练
- ❌ 关键人员不在岗
- ❌ 业务高峰期
- ❌ 当前已经有未解决的故障
- ❌ 大客户参观 / 演示前一天