一般的に意味のノード輸出使用プロメテウス監視指標

I.説明

プロメテウスは、最近、監視システムは、最後の統一された計算方法を計算するための同じ式を収集しないことが見出されているcentos7メモリ取込みメモリ下新しいcentos6および監視指標を構築するために使用され、以下のように計算される分析します。

1
100-(node_memory_MemFree_bytes+node_memory_Cached_bytes+node_memory_Buffers_bytes) /node_memory_MemTotal_bytes *10

 

意味の二つ、ノード輸出一般的に使用される指標(参考資料)

https://www.gitbook.com/book/songjiayang/prometheus/details(プロメテウスの戦闘) 

https://github.com/1046102779/prometheus(プロメテウス非公式中国のマニュアル)

http://www.bubuko.com/infodetail-2004088.html(K8Sクラスタを監視ベースプロメテウス)

http://www.cnblogs.com/sfnz/p/6566951.html(プロメテウス+ grafana監視MySQLのRedisのを搭載するなど、実装されている非ドッカーをkubernetes)

https://github.com/kayrus/prometheus-kubernetes(プロメテウス-kubernetes) 

https://github.com/prometheus/node_exporter(プロメテウス/ node_exporter)

http://dockone.io/article/2579(Kubernetesでプロメテウスの監視の実践)

https://github.com/prometheus/prometheus/releases(プロメテウスダウンロードリスト)

https://github.com/prometheus/node_exporter/releases/(ダウンロードリストnode_exporter)

 

 

 

概念を前提:

1.統計的指標の発生のような時系列の値に列の同じ数の時系列は、配列の

2.式 

=:正確に等しい文字列ラベルを選択します

!=:等しくない文字列ラベルを選択

=〜:タグにマッチする正規表現を選択する(またはサブラベル)

!〜:正規表現タグ(またはサブラベル)と一致しないことを選択します

3.時間の定義

S:秒

M:分

時間:時間

D:日

W:週

Y:年

注意:[5メートル]は、最後の5分を指し、

4.演算子

BOOL

そして

若しくは

ない限り、

なし:(ラベル)の結果で括弧内にラベルと値を取り外すことなく、

(ラベル)によって結果にカッコ内のみのラベルと値を予約者:

 

1.CPUアイドル率

1
sum (irate(node_cpu{mode= "idle" , instance= "134node" }[1m])) * 100 / count_scalar(node_cpu{mode= "user" , instance= "134node" })  

コメント:

##インスタンスは:ラベル、実際の具体的な構成を指し、また、定期的に一致させるために使用することができます

##モード:CPUモードを指し、ノード・輸出は、這い出たノード・輸出国でip展開することができます。このウェブサイト上の9100ビュー

                    たとえば、次のhttp://172.17.123.134:9100 /メトリック

## SUM()関数は:インジケータは、括弧内の合計値を意味します

##激怒()関数:瞬間ごと手段(毎秒)の時系列計算範囲の速度ベクトルを(算出します 

                          範囲ベクトルにおける時系列の増加毎秒瞬間レート)

## count_scalar()関数:それは時系列ベクトルのスカラー結果として要素の数を指す(の数を返します     

                                      スカラーとして時系列ベクトルの要素)

 

2.CPU負荷率

1
node_load1{instance= "134node" } / count by(job, instance)(count by(job, instance, cpu)(node_cpu{instance= "134node" })) 

コメント:

##はnode_load1:5分、cpu_load15フィンガ15上CPUが1分以内に平均負荷を指し、同じ手段cpu_load5 CPU負荷平均    

                           数分以内にCPU負荷平均

##カウント:重合のベクトルの各要素を指す(すなわち、カウント)

##フォローアップのノートを追加します

 

3.使用可能なメモリ

1
node_memory_MemAvailable{instance= "88node" }  

コメント:

## node_memory_MemAvailable:メモリ情報フィールドMemAvailable、ノード輸出国だけでクエリを表示するには、這い出ています。

    注意:異なるシステムのインデックスが異なる集めることで、あなたはCentOS6.Xにこの指標を収集することはできません;かもしれCentOS7。

 

4.自由なファイル・システム・スペース

1
2
3
sum (node_filesystem_free{fstype= "xfs" ,instance= "88node" })  
 
sum (node_filesystem_free{fstype= "ext4" ,instance= "134node" })

## node_filesystem_free:バイトの空き領域をファイルシステム上

##以下の種をFSTYPE:

## AUFS:一緒に結合された2つの本来別々のファイルシステム用結合ファイルシステムを指し

##のcgroup:のcgroup(対照群)は、リソースの統計情報を制限するために使用されるLinuxカーネルの機能、および別のプロセスグループであります  

                   (CPU、メモリ、ディスク入出力)。

## TMPFS:TMPFSは、仮想メモリ・ファイル・システムではなく、ブロックデバイスです。

##オーバーレイ:オーバーレイ・ファイル・システムは、2つのファイルシステムが含まれている、ファイルシステム上下のファイルシステム  

                      このシステムは、新たな共同文書システムです 

### PROC、XFS、mqueueをというように。

 

ハードディスクからメモリへまたはメモリからハードディスクに、仮想メモリスワップ:ハード・ディスク・スワップ5.swap

空きスワップ:

1
node_memory_SwapFree{instance= "134node" }

## node_memory_SwapTotal:メモリ情報フィールドSwapTotal。

##スワップ:ハードディスクと同様に、メモリを使用することができる場合、このセクションは、一般的に呼ばれるスワップ・メモリ

 

スワップの使用量:

1
node_memory_SwapTotal{instance= "134node" } - node_memory_SwapFree{instance= "134node" }

## node_memory_SwapFree:メモリ情報フィールドSwapFree

 

スワップI / O(中):

1
rate(node_vmstat_pswpin{instance= "88node" }[1m]) * 4096 or irate(node_vmstat_pswpin{instance= "88node" }[5m]) * 4096

 

スワップI / O(アウト):

1
rate(node_vmstat_pswpout{instance= "88node" }[1m]) * 4096 or irate(node_vmstat_pswpout{instance= "88node" }[5m]) * 4096

 

##のvmstat:vmstatのコマンドは、状態の所定の時間間隔値でサーバーを表示することができ、最も一般的なLinux / Unixの監視ツールです 

                    IOは、条件の読み取りと書き込み、サーバーのCPU使用率、メモリ使用率、仮想メモリのスワップ場合、を含みます。

## pswpin / S:ハードディスク交換ゾーンにメモリから転送された秒当たりの回数。

## pswpout / S:ハードディスク交換ゾーンにメモリから転送された秒当たりの回数。

## pswpin / S、pswpout / sがハードディスクスワップスワップ活性に関連で説明されています。システムの効率化に関連する取引。交換ゾーンで

     あなたのハードディスク上のハードディスクを読んで、システムの効率を改善するためには、それゆえ、はるかに遅く、書く、読むよりもメモリの書き込み操作は、交換を削減しようとする必要があります。  

     通常の練習は、交流活動スワップがゼロ、またはゼロに近くなるように、メモリを増やすことです。値swpot / sの大の場合

     (バッファは空きメモリ空間の一部の放出を減少することができます)、バッファメモリを増減する可能性の必要性を示し、1に。

 

スワップフリーレート(百パーセント)

(node_memory_SwapFree {インスタンス=〜 "$サーバ"} / {node_memory_SwapTotalインスタンス=〜 "$サーバ"})×100

 

6.CPUの使用状況

1
avg without (cpu) (irate(node_cpu{instance= "88node" , mode!= "idle" }[5m]))

##平均:平均

 

7.インターネット利用

スピードをアップロード:

1
irate(node_network_transmit_bytes{device!= "lo" ,instance= "88node" }[1m])

ダウンロード速度:

1
irate(node_network_receive_bytes{device!= "lo" ,instance= "88node" }[1m])

##はeth0:イーサネット速記、一般的にイーサネットインタフェースに使用。

## wifi0:無線LANは、無線ローカルエリアネットワークであるので、wifi0一般に無線ネットワークインターフェースを指します。

## ATH0:アセロスの速記は、一般アセロスが含まれる無線ネットワークインターフェースチップを指します。

## tunl0:tunl0トンネルインタフェースは、データのカプセル化を使用して、時間であります

## LO:ローカル速記、一般的にローカルループバックインタフェースを指します。

 

8.メモリ使用量

使用されるメモリ:(総メモリ - 空きメモリ - =キャッシュメモリを使用)

      node_memory_MemTotal {インスタンス= "88node"} -  

      node_memory_MemFree {インスタンス= "88node"} - 

      node_memory_Cached {インスタンス= "88node"} - 

      node_memory_Buffers {インスタンス= "88node"} - 

      node_memory_Slab {インスタンス= "88node"}

 

バッファ・キャッシュ:

     node_memory_Buffers {インスタンス= "88node"}

キャッシュされたキャッシュ:

     node_memory_Cached {インスタンス= "88node"}  

     + node_memory_Slab {インスタンス= "88node"}

無料空きメモリ:

     node_memory_MemFree {インスタンス= "88node"}

 

使用可能なメモリの割合:

1
2
3
(node_memory_MemAvailable{instance= "88node" } /
 
node_memory_MemTotal{instance= "88node" }) * 100

 

##合計:物理メモリの合計サイズ。

##フリー:どのくらいの空きメモリ。

##共有:複数のプロセスは、メモリの合計を共有することができます。

##バッファ:一般読み取りおよび書き込みバッファブロックデバイスのみが必要であり、メモリの数はキャッシュバッファ表します

##キャッシュ:ファイルシステムのために、一般的に、メモリにキャッシュされたキャッシュされたページの数は頻繁にアクセスされるファイルを表し    

                  キャッシュされました。キャッシュされた値が大きい場合は、それがキャッシュされたファイルのより多くの数を意味します。この時点では双方向IOが比較的小さい場合には、それがあります                                                                                                                                                    

                  ドキュメンテーションシステムの効率が優れています

##スラブ:スラブ・アロケータは、動的なメモリ管理機能を提供するだけでなく、メモリキャッシュとして頻繁に割り当てられて、解放することができるだけでなく

## MemAvailable:無料+バッファ+キャッシュ - 回復不能な部分。非回収部であって、共有メモリセグメント     

                             tmpfsは、ramfs等

 

(IOPSの)9.ディスクの読み書き

ディスクは毎秒読み込み(5分以内)

1
sum  by (instance) (irate(node_disk_reads_completed{instance= "88node" }[5m]))

## node_disk_reads_completed:正常に完了した読み込みの総数

ディスクの毎秒の書き込み(5分以内)

1
sum  by (instance)(irate(node_disk_writes_completed{instance= "88node" }[5m]))

## node_disk_writes_completed:正常に完了した書き込みの合計数。

I / Oのミリ秒を使用します(5分以内)

1
sum  by (instance) (irate(node_disk_io_time_ms{instance= "88node" }[5m]))

## node_disk_io_time_ms:合計ミリ秒のI / Oに費やさ

毎秒読み総ディスク(5分以内)

1
sum  by (instance) (irate(node_disk_reads_completed{instance= "88node" }[5m])) +  sum  by (instance) (irate(node_disk_writes_completed{instance= "88node" }[5m]))

 

10.I / Oの使用方法

総ディスク読み取り(1分)

1
sum (irate(node_disk_bytes_read{instance= "88node" }[1m]))

## node_disk_bytes_read:(バイトの数が正常に読み取る)が正常に読み取られたバイトの総数

総ディスク書き込み(1分)

1
sum (irate(node_disk_bytes_written{instance= "88node" }[1m]))

## node_disk_bytes_written:(正常に書き込まれたバイト数)が正常に書き込まれたバイトの総数

I / Oの(1分)を使用して、ミリ秒

1
sum (irate(node_disk_io_time_ms{instance= "88node" }[1m]))

## node_disk_io_time_ms:合計ミリ秒(ミリ秒単位の合計数を使用してIO)I / Oをやって過ごしました。

 

11.ファイルシステムの空き容量

最低:

1
min(node_filesystem_free{fstype=~ "xfs|ext4" ,instance= "88node" } / node_filesystem_size{fstype=~ "xfs|ext4" ,instance= "88node" })

最高値:

1
max(node_filesystem_free{fstype=~ "xfs|ext4" ,instance= "88node" } / node_filesystem_size{fstype=~ "xfs|ext4" ,instance= "88node" })

linlliある:## ext4のは、拡張ファイルシステム(ext4のと略記第四拡張ファイルシステム、英語)の第四世代であります

     Linuxでは、ファイルシステムのログを、ファイルシステムの容量は、ext4のの1EBに達しながら、16TBまでのファイル

## XFSは、実際に展開されたときに、ホストオペレーティングシステムに応じて、最大1バイトのマイナス8EB単一のファイルシステムをサポートしている64ビットのファイルシステムです  

     最大ブロックシステムを制限します。32ビットLinuxシステムでは、ファイルとファイルシステムのサイズは、16TBに制限されます。

オリジナルます。https://blog.csdn.net/ffzhihua/article/details/88131507 

おすすめ

転載: www.cnblogs.com/linyouyi/p/11242478.html