前回はHadoopやSparkなどとの連携について見てきました。今回は、 得られたデータに対し、 実際の分析に入っていくことにしましょう。 ログ分析用のSQL拡張関数 ログ分析のためのロジックは、 SQL関数を組み合わせて作成したり、 ユーザー定義関数 (UDF) を ...
前編では、 ビッグデータを高速集計/ 分析するためのデータベース 「Vertica」 について、 基本的なアーキテクチャ (列指向型、 データ圧縮、 MPP) や強み (多重アクセスの負荷分散、 プロジェクションによる自動チューニング) を紹介しました。