Elasticsearchの集計機能について調べてみた

『サーバ/インフラエンジニア養成読本 ログ収集〜可視化編』 出版記念!執筆者が語る大講演会! で大谷さん(@johtani)がelasticsearchの集計機能について話していたので、少し調べてみた。

集計機能(aggregation)

Aggregations elasticsearchには検索だけでなく結果を多段で分析をすることができるらしい (残念ながらKibana3はサポート外)

Bucketing

(マニュアルの翻訳) * 集約されているドキュメントから何らかの形で抽出された値に基づいて、この家族のコンピュート·メトリクスにおける集計。 値は、典型的には、(フィールドデータを用いて)文書​​のフィールドから抽出されるが、スクリプトを使用して生成することができる。

mentrics

  • バケット集計は集計が行うメトリクスなどの分野にわたってメトリックを計算しませんが、その代わりに、彼らは文書のバケットを作成します。 各バケットは、現在のコンテキスト内でドキュメントがその中に「落ちる」か否かを判断する(集約タイプに応じて)判定基準に関連している。 換言すれば、バケットは、効果的に文書セットを定義する。 バケット自身に加えて、 bucket集計は、各バケットに"に落ちた」との文書の数を計算して返します。

結構すごいなーと思った。使い方とかはもっと調べないといけないので、追記するかもでー