规划空间
合理规划能显著提升后期运维效率。| 场景 | 推荐做法 | 原因 |
|---|---|---|
| 独立业务团队 | 按团队创建空间 | 告警数据纯净,分派策略精准 |
| 多业务共用监控 | 按业务模块创建空间 | 避免配置混乱,减少误派 |
创建空间
1
进入创建页面
进入 协作空间 → 创建协作空间
2
填写基本信息
填写 空间名称,建议以业务类型或团队命名
3
选择管理团队
选择 管理团队,该团队成员拥有空间的全部操作权限
4
设置访问级别
- 公开:账户内所有用户可见,可查看和操作故障,但无法修改空间配置
- 私有:仅管理团队、创建者和账户管理员可见
5
配置超时自动关闭(可选)
- 故障触发后自动关闭:从故障首次触发开始计时,适合未自动恢复的告警
- 停止合入新告警后自动关闭:从最后一次合入新告警开始计时,适合开启聚合降噪的场景
6
开启新奇故障检测(可选)
开启后,故障列表及通知内容中将带有”新奇故障”标识,便于快速识别。了解更多
7
完成创建
点击 下一步 完成创建
配置核心能力
空间创建后,在详情页完成以下配置:接入告警
在 集成数据 页签创建告警集成,将监控系统的告警接入本空间。- 每种类型集成会生成独立的 Webhook 地址
- 可配置 排除规则 过滤测试数据或无效告警
配置分派策略
在 分派策略 页签定义故障的通知路径:通知谁、怎么通知、超时如何升级。- 多条策略按优先级从上到下匹配,匹配即停止
- 支持拖动调整策略顺序
配置告警降噪
在 降噪配置 页签将海量告警收敛为少量故障:| 能力 | 说明 |
|---|---|
| 聚合降噪 | 将同一主机、同一服务的相似告警合并为一条故障 |
| 抖动检测 | 自动识别并屏蔽短时间内反复震荡的告警 |
| 静默策略 | 在预定的维护窗口或特定时间段,临时屏蔽特定条件下的告警通知 |
| 抑制策略 | 利用告警之间的依赖关系减少冗余通知 |
管理空间
查找空间
- 点击空间卡片上的 星标 收藏高频使用的空间
- 通过 团队筛选 或 我收藏的 快速定位目标空间
- 使用右上角 排序 功能调整空间顺序,仅对当前用户生效
变更配置
进入 空间详情 → 基础设置,可修改:- 空间名称、描述
- 管理团队
- 超时自动关闭策略
禁用与删除
| 操作 | 说明 |
|---|---|
| 禁用 | 停止接收新告警,保留历史数据和配置 |
| 删除 | 永久销毁空间及所有配置,包括故障数据且不可恢复 |
处理故障
在 故障列表 页签进行故障处理:- 通过 处理进度 筛选待处理、已认领、已关闭等状态
- 选择多个相同状态的故障进行 批量关闭 或 批量认领
- 使用 合并 功能将指向同一根因的故障合并处理,支持跨空间合并
常见问题
管理团队与访问级别有什么区别?
管理团队与访问级别有什么区别?
- 管理团队:控制谁可以修改空间配置(集成、分派策略、降噪规则等)
- 访问级别:控制谁可以看到空间及其故障。公开空间所有人可见但只有管理团队能改配置;私有空间仅管理团队可见
两种超时自动关闭策略如何选择?
两种超时自动关闭策略如何选择?
- 如果告警源没有自动恢复事件且未开启聚合降噪,选择 故障触发后自动关闭
- 如果开启了聚合降噪,选择 停止合入新告警后自动关闭,确保聚合窗口内的告警都能被处理
删除空间后故障数据还在吗?
删除空间后故障数据还在吗?
不存在,空间配置(集成、分派策略等)将被永久删除且不可恢复。