運行時性能問題的首要指標之一是來自 JVM 分析器或 JAVA 監控工具的高 Java CPU 使用率報告。但是,windows 和 linux 上的高 Java CPU 利用率問題并不總是容易解決。
例如,如果應用程序過度分配實例,當對象引用超出范圍時,垃圾收集器 (GC) 將被迫采取行動。越來越頻繁的 GC 周期不僅會觸發 JVM stop-the-world 事件,使應用程序看起來沒有響應,而且還會導致 Java CPU 使用率飆升。GC 問題的糾正與實現更高效的算法或邏輯工作流無關。解決方法是解決底層對象分配問題,即低效使用內存并觸發不必要的 GC。
Java CPU 指標可能會產生誤導
具有爭用問題的阻塞線程也可能導致 JVM 分析器工具報告 100% 的 Java CPU 利用率。并發問題和死鎖并不是真正的處理器問題,而是線程分配方式的問題,以及它們訪問的方法是同步的還是阻塞的。
CPU 利用率也可能是一個誤導性指標。
當 CPU 處于空閑狀態時,它會將其狀態報告為未使用,因為它沒有做任何工作。但是,當線程被阻塞時,它們會將 CPU 置于等待狀態。CPU 處于等待狀態時不執行任何邏輯,但它會向 JVM 分析工具報告它很忙,盡管它什么都不做。
此外,不要僅僅因為你的硬件報告了 100% 的 CPU 利用率,就認為是 JVM 導致了它。當你的應用程序處于負載狀態時,CPU 使用率可能會飆升,但該峰值可能歸因于系統進程或軟件堆棧的錯誤配置。如果服務器的虛擬內存配置錯誤,頁面文件抖動將消耗大部分 CPU 周期。DevOps 團隊或系統管理員需要解決虛擬內存問題,這不是由你的應用程序或你如何調整 JVM 性能造成的問題。
最常見的 Java 性能問題
大多數 JVM 性能問題可以追溯到 I/O 操作,例如寫入文件系統或與后端關系數據庫管理系統或消息隊列的交互。配置錯誤的數據庫連接池(其中不斷創建和銷毀資源以向 Spring 和基于 JPA 的應用程序提供 Java 數據庫連接)可能會觸發高 Java CPU 使用率。糟糕的 I/O 資源管理也會導致內存泄漏,以及不可避免的 OutOfMemoryError。
另一個導致 Java CPU 使用率高的誤導性來源是設計不佳的 RESTful API,它對其他服務進行過多的網絡調用。具有大量 HTTP 請求的聊天應用程序,以及在每個請求-響應周期中解析 JSON 和 XML 的相關開銷,通常會觸發 100% Java CPU 使用率報告。隨著開發人員將軟件單體重新架構為微服務,這個問題在現代企業架構中變得越來越普遍。
Java CPU 使用率高的外圍原因
糟糕的 JVM 內存管理;
Java GC 配置不當;
更正確地歸因于軟件堆棧的問題;
線程同步、爭用和死鎖問題;
底層文件和數據庫 I/O 問題。
只有在根本原因分析消除了這些問題作為高 Java CPU 使用問題的潛在原因之后,才應該花時間對代碼中的潛在問題進行故障排除。
Java CPU 使用率高的直接原因
當你的 Java 代碼對 CPU 造成太大壓力時,罪魁禍首可能是什么?高 Java CPU 使用率問題的最常見、直接可歸因的原因包括:
無限循環
無論是柵欄錯誤還是草率的開發,程序員開始循環并錯誤地編碼打破它的條件并不是聞所未聞的。結果是一個除了消耗時鐘周期之外什么都不做的無限循環。如果有多個線程訪問這行代碼,那么你的多線程應用程序只會進行無意義的迭代。消除無限循環,CPU 使用應該恢復正常。
寫得不好的工作流程和算法
CPU 執行邏輯。如果應用程序包含編寫不佳的工作流程,并且代碼像意大利面條一樣連接在一起,那么你的 CPU 將吞噬不必要的時鐘周期。更新常用的工作流程并重新處理性能不佳的算法,以充分利用 CPU。
遞歸邏輯
雖然一些編程語言針對遞歸邏輯進行了優化,但 Java 不是其中之一。遞歸算法創建難以突破的線程,分配不易被垃圾收集算法回收的對象,并且它們創建了難以展開的 Java 堆棧框架塔。考慮到 StackOverflowError 的迫在眉睫的威脅,迭代超過遞歸算法的情況并不難實現。
選擇不當的集合類
列表處理是大多數企業應用程序的核心。因此,開發人員有許多集合類可供選擇。如果開發人員在大型數據集上選擇使用 LinkedList 而不是 ArrayList,則 CPU 利用率將飆升。同樣,如果開發人員選擇使用舊的 Hashtable 而不是 HashMap,同步可能會不必要地消耗時鐘周期。選擇錯誤的 Java 集合類,應用程序性能將受到影響。選擇正確的集合類,你的 Java CPU 使用率高的問題就會消失。
重新計算已計算的值
在整個應用程序中多次計算給定值的情況并不少見。如果是這種情況,請將第一次計算的結果保存在一個變量中,并在以后的所有交互中引用該變量。像這樣的小改動會對應用程序性能產生重大影響,尤其是在涉及加密、圖形操作或其他 CPU 密集型操作的情況下。
借助 Java Flight Recorder 之類的良好 JVM 分析器以及可用于檢查結果的 JDK Mission Control 工具之類的分析工具,確定導致 Java CPU 使用率過高問題的罪魁禍首應該不是問題。一旦確定,找到修復只是實施新的軟件例程并測試結果直到修復的問題。