Nagiosのnrpeを使ってSidekiqの仕事具合を監視する
SidekiqはRuby製の便利なJobWorkerでRubyのコードをいい感じに実行してくれるできる子なのですが、放置していると意識がなくなることもないとは言えないので、他の子に監視してもらうのが安全です。
今回はNagiosさんに監視をしてもらおうと思います。Nagiosはシステム監視ツールです。
nrpeはNagiosの機能で、監視対象のマシンで任意のコードを実行し、終了コードを元にwarning, criticalの通知ができます。
例えば以下のようなbashのスクリプトを用意して、SidekiqのAPIを呼び出せばworkerがうまくjobを処理しきれているか確認してみます。
他にfailしたジョブの数を調べることもできてSidekiq::Stats.new.failed
などを監視するのもありかなと思います。
sidekiqのAPIは https://github.com/mperham/sidekiq/wiki/API を参照してください。