CPUの監視

cpu.png

CPUの負荷を確認する。CPUに負荷がかかる原因としては、CPUの処理能力不足やアプリケーションの処理が効率的でないことが考えられる。


監視内容

CPUの監視項目は、1分/5分/15分の平均値を監視できます。

監視項目 アイテムキー 説明
CPU使用率(system1) system.cpu.util[,system,avg1] システムレベル(kernel)でCPUが消費された時間の割合
CPU使用率(perf_counter) perf_counter[\Processor(_Total)\% Processor Time]

※Windowsのみ使用可能

CPUが消費された時間の割合
CPU使用率(nice1) system.cpu.util[,nice,avg1]

※Windowsでは使用できません

優先度(ナイス値)によるユーザーレベルでCPUが消費された時間の割合
CPU使用率(user1) system.cpu.util[,user,avg1]

※Windowsでは使用できません

ユーザレベルでCPUが消費された時間の割合
CPU使用率(iowait1) system.cpu.util[,iowait,avg1]

※Windowsでは使用できません

CPUがディスクI/O待ちのためにアイドル状態で消費した時間の割合
CPU使用率(steal1) system.cpu.util[,steal,avg1]

※Windowsでは使用できません

XenなどのOSの仮想化を利用している場合に、ほかの仮装CPUの計算で待たされた時間の割合
CPU使用率(idle1) system.cpu.util[,idle,avg1]

※Windowsでは使用できません

CPUのアイドル時間の割合(ディスクI/Oの待機時間は除く)
CPU使用率(interrupt1) system.cpu.util[,interrupt,avg1]

※Windowsでは使用できません

CPUの割り込み実行時間の割合
CPU使用率(softirq1) system.cpu.util[,softirq,avg1]

※Windowsでは使用できません

CPUのソフトウェア割り込み実行時間の割合
ロードアベレージ(1m) system.cpu.load[,avg1] CPUの負荷(1分間の平均)
ロードアベレージ(5m) system.cpu.load[,avg5] CPUの負荷(5分間の平均)
ロードアベレージ(15m) system.cpu.load[,avg15] CPUの負荷(15分間の平均)

検証環境

Zabbixのバージョン

Server:3.0.7
Agent:3.0.10
Agent:3.0.14

 

検証OS

・Windows Server 2012
・Windows Server 2003
・Windows10
・Windows7
・CentOS 6.8

 

Zabbix Agentをインストールしている環境では、WindowsでもLinuxでも同じアイテムキーを使用できることが多いです。ただし、取得するアイテムによってはWindowsのみ、もしくはLinuxのみでしか使用できないキーもあります。更にOSのバージョンによっても差異があります。

アイテムの設定

CPU使用率(system1)

・名前:05.CPU使用率(system1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,system,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(perf_counter)

・名前:06.CPU使用率(perf_counter)
・タイプ:Zabbixエージェント
・キー:perf_counter[\Processor(_Total)\% Processor Time]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(nice1)

・名前:10.CPU使用率(nice1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,nice,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(user1)

・名前:15.CPU使用率(user1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,user,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(iowait1)

・名前:20.CPU使用率(iowait1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,iowait,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(steal1)

・名前:25.CPU使用率(steal1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,steal,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(idle1)

・名前:30.CPU使用率(idle1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,idle,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(interrupt1)

・名前:35.CPU使用率(interrupt1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,interrupt,avg1]
・データ型:数値(浮動小数)
・単位:%

 

CPU使用率(softirq1)

・名前:40.CPU使用率(softirq1)
・タイプ:Zabbixエージェント
・キー:system.cpu.util[,softirq,avg1]
・データ型:数値(浮動小数)
・単位:%

 

ロードアベレージ(1m)

・名前:51.ロードアベレージ(avg1)
・タイプ:Zabbixエージェント
・キー:system.cpu.load[,avg1]
・データ型:数値(浮動小数)

 

ロードアベレージ(5m)

・名前:52.ロードアベレージ(avg5)
・タイプ:Zabbixエージェント
・キー:system.cpu.load[,avg5]
・データ型:数値(浮動小数)

 

ロードアベレージ(15m)

・名前:53.ロードアベレージ(avg15)
・タイプ:Zabbixエージェント
・キー:system.cpu.load[,avg15]
・データ型:数値(浮動小数)

動作確認

アイテムの設定が完了したら、データが問題なく取得できているか確認します。
「監視データ」-「最新データ」をクリックします。
右上にあるホスト欄で、監視対象機器を選択します。
データが取得できているか確認します。

Windows Server 2012

zabbix-monitoringitem-cpu-05.png

 

CentOS 6.8

zabbix-monitoringitem-cpu-10.png

 

対応していないアイテムキーは、データが取得できないので、赤い×マークがつきます。

設定例

サンプル1

CPU使用率は60秒ごとにデータを収集する。
CPU使用率の閾値は80パーセントとする。
5回連続で閾値を超えたらアラートメールを送信する。
閾値を超えている限り、1時間毎にアラートメールを送信する。

 

環境

Server:3.0.7
Agent:3.0.4

 

アイテムの設定

zabbix-cpu-monitoring10

 

トリガーの設定

{Test Template CPU usage:system.cpu.util[,system,avg1].last(#5)}>80
zabbix-cpu-monitoring20

 

アクションの設定

zabbix-cpu-monitoring30

トップへ戻る