本文最后更新于 48 天前,其中的信息可能已经有所发展或是发生改变。
吞吐量指标
| 指标 | 全称 | 含义 | 常见单位 |
|---|---|---|---|
| QPS | Queries Per Second | 每秒处理的请求数。用于表示接口或系统整体吞吐能力。 | 次/秒 |
| TPS | Transactions Per Second | 每秒事务数,通常用于数据库、支付系统等强调事务语义的系统。 | 次/秒 |
| OPS | Operations Per Second | 每秒操作数,常用于存储系统(如 Redis、MongoDB)表示读写操作频率。 | 次/秒 |
| RPS | Requests Per Second | 每秒请求数,等价于 QPS。 | 次/秒 |
常使用 QPS 和 OPS 作为系统的性能指标,QPS 用于衡量系统整体,接口层的吞吐,OPS关注底层的吞吐。
延时指标
| 指标 | 全称 | 含义 | 单位 |
|---|---|---|---|
| p50 (median) | 50th Percentile (Median) | 50% 的请求延迟低于该值,即中位数,反映典型用户体验。 | ms(毫秒) |
| p90 | 90th Percentile | 90% 的请求延迟低于该值,说明有 10% 的请求更慢。 | ms |
| p95 | 95th Percentile | 95% 的请求延迟低于该值,常用于衡量高延迟尾部性能。 | ms |
| p99 | 99th Percentile | 99% 的请求延迟低于该值,衡量系统尾部性能(最慢 1% 请求)。 | ms |
| mean(平均值) | Mean Latency | 所有请求的平均响应时间,容易受极端值影响。 | ms |
| max / min | Maximum / Minimum Latency | 最大与最小响应时间,通常只做参考。 | ms |
延时主要关注 P99 和 P95,P99 能够体现出用户最差的体验,P95 比较接近真实用户体验。
稳定性指标
| 指标 | 全称 | 含义 | 计算方式 / 说明 | 单位 |
|---|---|---|---|---|
| Success Rate | 成功率 | 系统请求成功的比例 | 成功请求数 ÷ 总请求数 | % |
| Availability | 可用性 | 系统在一定时间内可正常提供服务的比例 | 可用时间 ÷ 总时间 × 100% | % |
| SLA | Service Level Agreement | 服务等级协议,客户与服务提供方签署的可用性或性能承诺 | 约定的目标值(如 99.9% 可用) | % / SLA指标值 |
| SLO | Service Level Objective | 服务等级目标,服务内部设定的目标值 | 内部目标值,通常 ≤ SLA | % / SLO指标值 |
| SLI | Service Level Indicator | 服务等级指标,用于衡量实际服务性能 | 实际可用性或成功率的测量值 | % / SLI实际值 |
主要关注成功率和可用性指标,衡量系统是否高可用和稳健。