Latensi = permintaan → waktu respons (ms). Lebih rendah lebih baik—tetapi penjahat sebenarnya adalah latensi ekor: lonjakan 😫 lambat sesekali Saat latensi berayun, aplikasi terasa gelisah, percobaan ulang menumpuk, dan infrastruktur menjadi lebih keras di bawah beban.