1人体制での死活監視

平成21年2月22日(日) 00時00分00秒
区分
システム管理
報告者:
komagata

一定規模以上のWebサイトを運営しているエンジニアの方、業務時間外の障害対応ってどういう風にやっていますか? ルールとか体制とかを中心に教えてほしいです。 ちなみに.. – 人力検索はてな

ちなみにぼくの会社では、監視ツールや自作監視スクリプトでアラートをエンジニア社員全員に送って、誰かが対応することになっています。(たまに誰も対応やレスをしなくて上司に怒られます) これはぼくら社員にとって正直ストレスになるので、なにかよいルールや体制を上司に提案したいなと考えています。
はてなでこういう質問がありました。たしかに大きいところではストレスになりますよね。 うちは「一定規模以上のWebサイトを運営してい」ないので特にストレスは感じないです。(アラート受ける人も2人しかいないし・・・)
Montasticという無料でWebのステータスをチェックしてアラートを送ってくれるサービスを使っています。
これだとHTTPしかチェックしてくれないのでライブドアのDATAHOTEL PATROLというやつも試してみたいところです。
それとRailsのExceptionNotifierプラグインのみです。
社内に監視システムを構築するとその監視システム自体の維持が大変なのでやってません。
品質とのトレードオフだと思いますが、基本的に、
「人員1人体制想定でどこまで品質を高められるか」
という方向でがんばってみたいと思います。

トップページに戻る

本頁の来客数
九万八千五百四十七名

メンバー一覧

アクトインディ技師部隊員名簿

アクトインディ技師部元隊員

アクトインディへ

投稿する

カテゴリー

アクトインディ

aaaa