默认主体加载中…
DEMO 演示页面
当前业务范围尚未启用此模块,页面展示的是占位/示意数据,请勿当作真实业务指标。等接入对应数据后会自动切换。

Runbook

M17

故障处置预案 · 一键执行

暂无后端数据,下方为预设示例
P0
PG 主从切换 Runbook
主库故障时 30s 内切换到只读副本,数据丢失窗口 ≤ 5s
P1
Kafka 消费滞后处理
Lag > 10K 时触发分区扩容 + 消费者组重平衡
P1
M_BRAIN 模型回滚
Canary ROI < -2% 自动回退至 STABLE 版本
P2
巨量 API 限流处理
返回 429 时退避策略 + 切换备用 token
P3
OSS 上传失败补偿
Saga 自动补偿,重试 3 次后转人工审核
所有 Runbook 执行需经过 SRE 复核
一键执行会触发审计日志 · 5 分钟内可撤销