なんかかきたい

プログラミングなどの個人的なメモやサークル「ゆきいろパラソル」の情報を載せてます

ElasticSearchの運用とか (3)

監視周りの情報とかをペタペタと書きました。

ステータス監視

Munin

色々あるけど、これが有力そう。

Plugin/HQ

headプラグインと機能が被っている気がしなくもない。便利な管理ツール

Plugin/head

色々できるノードステータス監視ツール。便利

Plugin/bigdesk

HQやheadと似たようなElasticSearchクラスタの状態監視ツール。 HQやheadと比べてモニタリングの機能のみに注力しているイメージ。 その点多機能ではないが、シンプルで直近のElasticSearchノードの状態を見るには便利。

インデックス

ElasticSearchはデフォルトで最初に投入されたデータを元に自動的にスキーマを設定する機能があるので(簡単な意味でのスキーマレスと考える事もできる)、細かいインデックス設定をしなくともデータの投入を開始する事ができる。

一方で、多くのフィールドを自動的にstringと判断し、トークナイザーが走ってしまいインデックス効率が悪くなる事が想定できるので、ちゃんと運用しようと思うならインデックスする前に、データの型をこちら側で決めてしまったほうがよい。

テンプレート

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/indices-templates.html#indices-templates

日本語対応

解析エンジンを形態素解析をするか、N-Gramにするかにするかでインデックスがかなり変わってくる。

これはSolrを使う場合とほぼ同じ。 デフォルトでは1-Gramになっているので使い物にならない。

形態素解析エンジン kuromoji のelasticsearchプラグイン

kuromoji

ユーザ辞書

アニメタイトルのようなものは辞書に登録しておくと検索精度があげられてよいと思う。

辞書のメンテナンスについては以下の記事が参考になりそう。

elasticsearchの場合、ユーザ辞書はES_HOMEに置くらしい。

デフォルトの位置はコンフィグの位置と同じく、/etc/elasticsearch