produced by Cloud Ace

Stackdriver Kubernetes Monitoring触ってみたので感想書く

GCPリソースのモニタリングといえばStackdriver Monitoringが一般的ですが、Kubernetesに特化したモニタリングとして、Stackdriver Kubernetes Monitoring(以下SKM) がベータ段階のサービスとして登場しています。
SKMを使用することで、Kubernetesのnamespace毎の使用統計や、Pod毎のリソース割り当て量など、従来のStackdriver Monitoringではできなかった、Kubernetesの世界独自の指標を使った監視や可視化を行うことができます。今回はこれを使ってみて、画面のイメージと感想を共有します。

検証

  • n1-standard-2 を3台でGKEクラスタを構成
  • MarketplaceからCassandraをGKEクラスタにインストール
  • n1-standard-4 のComputeEngineから負荷をかけたときの状況を観測

総評

ところどころ気になる部分があるものの、Kubernetesに特化したリソース使用統計が望んだ単位で閲覧できるので、使用状況を監視するという観点では有用なサービスであるように感じました。
一方で、Pod単位のAlerting Policyを設定できればもっと良いなというのが本音です。
また、readinessやlivenessに失敗したことの監視ができると何かの役に立ちそうです。

面白いと思ったもの

readinessProbeの視覚化

Podの readiness を視覚化できます。以下の画像は app-cassandra-1 のreadinessチェックに失敗している様子です。

Namespaceで分離された使用統計

上の画像を見るとわかるように、 cassandra や kube-system namespace毎に使用統計が表示できます。namespaceを分けて複数のワークロードを1つのクラスタで実行する場合に割と便利かもしれません。

resources.requestsが見られる

画像中の CPU UTILIZATION や TOTAL MEMORY USAGE の左側の数字(0.5とか2.5GBみたいなやつ)はyamlファイルに定義したリソースのリクエスト量です。
どのPodがどのくらいのリソースを要求していて、現在の使用量がそのリクエストに対してどのくらいなのかがわかるのは個人的には面白いと感じました。

-負荷試験中の様子-


赤い線が何かはよくわかっていませんが、おそらく requestsに指定したリソースを実際の使用量が上回った時に赤くなっているのではないかと推測されます。
Podがどのくらいのリソース割り当てを持っていて、どのくらいの使用状況で、現在の設定が適切なのかどうかを判断できそうです。

イケてないところ

プルダウンが重い

cassandra-monitoring とか書いてある左側のプルダウンの反応があまり良くなくて使いづらかったです。

いつものことだけど単位が直感的ではない

メモリ使用率とCPU使用率を以下のようにグラフで見ることができます


おそらく割合を表示しているのだと思いますが、直感的ではないと思いました。
以上、まだまだビミョーなところはありますが、今後の発展に期待できそうなサービスでした。

次の記事を読み込んでいます
次の記事を読み込んでいます
次の記事を読み込んでいます
次の記事を読み込んでいます