接口响应慢怎么排查?后端 API 变慢与超时的定位步骤
接口 RT 抬高、超时增多、业务方开始催,这些现象经常会在同一时间冒出来;但真把现场拆开看,拖慢请求的那一段未必是同一个地方。
Java
这里按页继续往后翻,仍然围绕接口变慢、数据库等待、线程池、JVM 与线上问题排查这些问题。
接口 RT 抬高、超时增多、业务方开始催,这些现象经常会在同一时间冒出来;但真把现场拆开看,拖慢请求的那一段未必是同一个地方。
异步任务一旦开始堆积,现场很容易直接下意识地说:
缓存一致性这个话题,很多团队第一次认真面对,通常都不是在设计评审会上,而是在事故群里。
缓存命中率下降时,团队很容易先分成两派:一派说业务流量变长尾了,掉一点很正常;另一派说缓存方案肯定写坏了,不然不会掉得这么快。
18:18,结算确认接口 POST /settlement/confirm 的 p95 一下子从 220ms 抬到 3.1s。
Redis 内存一往上走,现场十有八九会先冒出一句话:
线程安全这个词,很多 Java 开发都不陌生。面试里会问,代码评审里也会提,线上问题排查时更容易绕不开。但它又特别容易被说成一种很抽象的东西:共享变量、可见性、原子性、锁、并发容器……概念很多,真到了项目里,反而不一定能第一时间意识到问题就在这里。
21:07,支付落单接口开始大面积报错: