延迟 = 请求 → 响应时间(毫秒)。 越低越好——但真正的罪魁祸首是尾延迟:那些偶尔出现的慢峰值 😫 当延迟波动时,应用程序会感到抖动,重试会堆积,基础设施在负载下会变得更嘈杂。