zCloud 智能诊断 · Case Study
智能诊断 / Intelligent Diagnosis — Case Study
滚动浏览 ↓
UI / UX Case Study

让数据库问题的
完整生命周期,被看见

把数据库诊断从"一堆散落的监控数据",重新组织成一条
"产生 — 演变 — 诊断 — 建议"的连续链路。

ROLE
UI / 全链路设计师
SCOPE
竞品 · 架构 · 交互 · 视觉 · 双模式
YEAR
2019 – 2024
RECOGNITION
国家外观设计专利
01 — 问题

告警只告诉你"出事了",
不告诉你"为什么"

痛点 01

告警是快照,不是过程

监控只记录告警那一刻的数据,但问题是渐变的。DBA 看到的是"结果",看不到问题如何一步步恶化,只能人肉回溯时间线。

痛点 02

信息散落,定位靠经验

指标、趋势、日志、问题详情散落在不同页面。资深 DBA 靠经验能拼出来,新手很难,专家也耗时。

痛点 03

诊断结果不可复用

每次诊断都是一次性的,专家判断经验无法沉淀,下次遇到类似问题还得从头再来。

02 — 设计目标

在一个界面内,
看到问题的完整生命周期

从产生、演变、到诊断、再到处理建议,形成一条连续可读的诊断链路,降低对个人经验的依赖,让普通运维人员也能快速定位根因。

03 — 竞品研究

市场止步于"监控展示",
诊断环节是断裂的

通用监控大盘

Grafana / Zabbix

强在指标采集与可视化,但只"展示数据",不"解释问题",根因仍需人工判断。

云厂商监控

云数据库洞察

开始有智能诊断,但深度绑定自家云,对异构数据库混合环境支持弱。

传统 APM

应用链路追踪

强在应用层,但对数据库内核的锁、等待事件、执行计划覆盖不深。

差异化切入点:不做又一个监控大盘,而是补上市场缺失的"诊断"环节,并把资深 DBA 的经验沉淀进产品。

04 — 信息架构

从场景出发组织信息,
而不是堆功能

按 DBA 三类真实运维场景组织整个模块:健康评分对应日常巡检,问题定义对应配置沉淀,快捷分析对应突发排查。

智能诊断 模块入口 健康评分 总览 · 诊断详情 · 指标 场景:日常巡检 目标:一眼发现异常对象 问题定义 检查点 · 诊断树 · 专家经验 场景:配置诊断规则 目标:经验沉淀成系统能力 快捷分析 实时诊断 · 问题列表 场景:突发问题排查 目标:快速定位当前故障
05 — 核心任务流

一条贯穿始终的诊断主路径

发现异常 → 查看状态 → 定位根因 → 回溯演变 → 完成处置 → 专家经验沉淀回诊断树,形成闭环。设计要点是"不让用户离开上下文"。

发现异常 健康评分总览 查看状态 进入诊断详情 定位根因 诊断树根因链路 回溯演变 当前 / 历史指标 完成处置 匹配风险 · 闭环 沉淀经验 上传专家经验 专家经验反哺诊断树,形成闭环
06 — 交付 · 总览

健康评分总览

卡片墙 + 微趋势曲线,以"严重度"为核心的颜色体系,让用户一眼发现异常对象。

致命 严重 警告 提示
健康评分总览页
诊断详情页 诊断树根因链路
07 — 交付 · 诊断

诊断详情 · 根因链路

健康评分条 + 诊断树,把问题根因一步步连成链路。从对象、趋势、问题到状态四个层次,在一条链路里连续完成判断。

08 — 交付 · 完整度

69 个高保真页面,
覆盖全部边界状态

不只做理想路径,系统性覆盖诊断前、加载中、诊断失败、未配置、无结果等状态;并提供 Light / Dark 双模式,适配长时间运维场景。

Dark 模式诊断详情 问题详情抽屉
09 — 结果

获国家外观设计专利,
客户认可诊断直观性

3 项
国家外观设计专利
(含本模块原创界面方案)
69
高保真页面交付
含 Light / Dark 双模式
全生命周期
问题可视化追踪
显著提升诊断效率

这个项目的核心价值,不是画了 69 个漂亮的界面,而是完成了一次从"用户真实痛点"到"系统化解决方案"的完整设计推导。