0
会員になると、いいね!でマイページに保存できます。
運用監視の自動化は、複雑化するアプリケーションやサービスに対して効率的かつ確実な運用監視を実現する上で、またコスト削減の意味でも重要な要素になってきています。運用監視の自動化は、どのように考えて実現していけばいいのでしょうか。
7月24日に産業技術大学院大学で行われたイベント「
July Tech Festa 2016」のセッション「運用自動化のための Re:ゼロから始める監視設計」は、そのための知見を得る上で大変参考になるものでした。この記事では、そのダイジェストを紹介します。
運用自動化のための Re:ゼロから始める監視設計
前佛雅人氏。
今日の私の話は、業界経験が豊富な方には当たり前すぎる内容かも知れませんが、自分だったら20年前にこれを知りたかったな、ということをまとめてみたつもりです。
私はもともとデータセンターの運用をずっとやっていました。
最近ではテクニカルエバンジェリストなどをやっています。基本的には新しめの技術を検証したり情報発信したりしています。
今日話そうと思っていることはだいたいこんなことです。
「自分はゼロから監視設計できます」と自信を持って言える人はいますか? 実はなかなかそういえる人はいないと思います。なぜかというと、ゼロから監視設計をするのは、知識があっても実際の運用経験がないとなかなかできないと思うからです。
なので、1つ目は監視設計するときにはこういうところに気を付けましょう、という話をします。
2つ目は、どうして私たちは失敗するのかという話です。どんなに対策をしても人は絶対に失敗をします。それを防ぐには手作業を減らす自動化しかないかなと思います。
3つ目は、自動化というとけっこう先走っている感じがありますが、そうではなくてこれまでの知識と経験を活かすための手段として自動化というものがあるのかなという考えを話そうと思っています。
正しく運用されているかを評価するのが監視
運用監視の設計と構築は、まずこういったシステムを動かしたいという目的があって始まります。
いわゆる「運用」といわれるものは、つねにシステムが正しく動き続けるためにあります。そして、そのシステムが正しく動いているかどうかを評価する仕組み、それが「監視」です。
監視ができないと、キャパシティプランニングだったり、障害発生時や通常ではない状態が発生したときのトラブルシューティングができません。
ですから、システムが正しく動いているかどうかを評価するものが監視である、ということを覚えておいてください。監視がないと運用が正しく回っているかどうかがわからないので、運用のために監視が不可欠なのです。
これが、入社時に私が知りたかったことのひとつです。最初はこの運用と監視の関係や全体像がまったくわからなかったんですね。
当時は自社製の監視ツールで、WebサーバやTelnetのポートを関ししていました。しかし、ツールを使っているだけで、なぜなんのために監視しているのか分からなかったのです。
しかし、お客様のWebサーバなどのシステム運用をするという視点に立つと、こうした監視項目が必要なのは当然なのだろうということが後から分かってきました。
つまり、なにを監視すればいいのか分からないというときには、なにを運用するのか、という部分から考え始めると分かりやすくなるのではないかと思います。
逆に言えば、この運用監視ツールがいいぞ、という話から始まってしまうと、そのツールでできることだけに運用監視の幅が狭まってしまいます。本来あるべき運用監視に対して、このツールではこれしかできません、というのでは本末転倒です。
そういうことにならないように、気をつけなくてはなりません。
【次ページ】 サーバは「ペット」から「家畜」へ
関連タグ