连接池等待变长那晚,我怎么确认是数据库阶段慢了,不是应用拿着连接不放?
20:06,库存预占接口 POST /inventory/reserve 的 p95 从 160ms 抬到 1.6s,Hikari 获取连接 p95 很快冲到 520ms。
阅读全文写给还在查日志、排问题的人
元的手记
这里主要写 Java、Spring Boot、数据库、线程池和线上问题排查。遇到线上问题时,你可以先看现象、日志和排查过程,再判断这条思路适不适合继续往下查。
精选导读
这是一篇更适合先读的代表文章。要是你正在查相近的问题,通常可以先用它判断思路是否对路,再决定要不要继续往下看。
20:06,库存预占接口 POST /inventory/reserve 的 p95 从 160ms 抬到 1.6s,Hikari 获取连接 p95 很快冲到 520ms。
阅读全文推荐阅读
Java · 2026/3/26
这类 SQL 排查我见得最多的一种卡法,是 explain 已经看过,索引也不像完全走歪,可接口还是慢,团队一下子就僵在原地。
Java · 2026/3/24
有一次晚高峰,值班群里 6 分钟之内进了 23 条告警。
Java · 2026/3/24
接口容量预算常见的失败,不是因为没人算,而是每个人只算了自己手里的那一段。流量同学盯 QPS,应用同学盯 timeout,框架同学盯线程池,结果每个数字单看都说得过去,拼到一次高峰或一次下游抖动里,系统还是会排队、超时、重试连着来。
Java · 2026/3/24
19:12,订单提交接口 POST /api/order/submit 的 p95 从 180ms 抬到 2.4s。
Java · 2026/3/24
很多人学 Arthas,都是从命令表开始记:
Java · 2026/3/24
线上 Java 排障时,很多团队都会同时提到这几样工具:
Java · 2026/3/24
那次告警出来时,值班群里已经有人先把一句话说满了:
Java · 2026/3/24
做缓存一致性设计时,团队最后几乎总会绕到三个方案上:
Java · 2026/3/24
很多缓存事故,真正开始失控,不是在 Redis 已经完全不可用的时候,而是在它只是先抖了一下的时候。
没找到对应文章,换个词试试,或者直接点一个标签看看。