这篇文章,我会分享一些我看到的相关的案例。

一次线上 OOM 问题分析 – 艾小仙 – 2023

  • 现象:线上某个服务有接口非常慢,通过监控链路查看发现,中间的 GAP 时间非常大,实际接口并没有消耗很多时间,并且在那段时间里有很多这样的请求。
  • 分析:使用 JDK 自带的jvisualvm分析 dump 文件(MAT 也能分析)。
  • 建议:对于 SQL 语句,如果监测到没有where条件的全表查询应该默认增加一个合适的limit作为限制,防止这种问题拖垮整个系统
  • 资料实战案例:记一次 dump 文件分析历程转载 – HeapDump – 2022

生产事故-记一次特殊的 OOM 排查 – 程语有云 – 2023

  • 现象:网络没有问题的情况下,系统某开放接口从 2023 年 3 月 10 日 14 时许开始无法访问和使用。
  • 临时解决办法:紧急回滚至上一稳定版本。
  • 分析:使用 MAT (Memory Analyzer Tool)工具分析 dump 文件。
  • 建议:正常情况下,-Xmn参数(控制 Young 区的大小)总是应当小于-Xmx参数(控制堆内存的最大大小),否则就会触发 OOM 错误。
  • 资料最重要的 JVM 参数总结 – JavaGuide – 2023

一次大量 JVM Native 内存泄露的排查分析(64M 问题) – 掘金 – 2022

YGC 问题排查,又让我涨姿势了! – IT 人的职场进阶 – 2021

  • 现象:广告服务在新版本上线后,收到了大量的服务超时告警。
  • 分析:使用 MAT (Memory Analyzer Tool) 工具分析 dump 文件。
  • 建议:学会 YGC(Young GC) 问题的排查思路,掌握 YGC 的相关知识点。

Java 中 9 种常见的 CMS GC 问题分析与解决 – 美团技术团 – 2020

这篇文章共 2w+ 字,详细介绍了 GC 基础,总结了 CMS GC 的一些常见问题分析与解决办法。

分类: JVM

0 条评论

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注