Link Search Menu Expand Document (external link)

Google Analytics

Table of contents

  1. データ取得方法
    1. WebAPI 経由で取得
      1. メリット
      2. デメリット
      3. データの流れ
      4. 実現するテクノロジー
    2. エクスポート設定
      1. メリット
      2. デメリット
      3. データの流れ
      4. 実現するテクノロジー

データ取得方法

WebAPI 経由で取得

メリット

  • GoogleAnalyticsのコンソール画面と同じデータなので、数字のズレを気にしなくて済む。
  • ツールの選択肢が幅広いので自社に適したアーキテクチャを選定できる。

デメリット

  • ローデータをそのまま使えるわけではないので、他データソースとの統合や集計に限界がある。

データの流れ

  • WebAPI → 任意のIntegrationソリューション (→ Amazon S3) → Amazon Redshift

実現するテクノロジー

  • AWS Lambda等で定期バッチを作成し、上記エンドポイントにリクエストを送る。
  • Amazon RedshiftからLambda UDF経由でAWS Lambdaを実行して、上記エンドポイントにリクエストを送る。
  • Amazon AppFlow を利用する。
  • CData AWS Glue Connector for Google Analytics を利用する。

関連:Integration

エクスポート設定

BigQueryのみ出力可能。

メリット

  • ローデータをそのまま使えるので、他データソースとの統合や集計が可能となる。
  • ストリーミングエクスポートは件数制限なく準リアルタイムにデータを連携できる。

デメリット

  • GoogleAnalyticsのコンソール画面を使い慣れている場合、数字を一致させるのは難しいため、混乱を招く恐れがある。
  • ツールの選択肢が1つだけなのでマルチクラウドを管理しなければならない。
  • 無料版かつ日次エクスポート設定だと1日の上限は100万イベントまでに制限される。
  • エクスポートの完了時間が約束されていない ため、ポーリング(または準ずるテスト&リトライ)の自動化を実装する必要がある。
  • ストリーミングエクスポートはデータ量に応じてBigQueryの料金がかかる。

データの流れ

  • Google Analytics → エクスポート設定 → BigQuery (→ Cloud Storage) → 任意のIntegrationソリューション (→ Amazon S3) → Amazon Redshift
  • BigQuery や Cloud Storage はデータ基盤ではなく、外部データソースという位置付けになる。

実現するテクノロジー

  • BigQuery からのデータ連携方法は別ページを参照。
  • Cloud Storage からのデータ連携方法は別ページを参照。