GA4の自動収集パラメータにはpage_titleがあり、以下のパラメータと共にすべてのイベントにおいて自動収集される。
- language
- page_location
- page_referrer
- page_title
- screen_resolution
参考:[GA4] 自動収集イベント -アナリティクス ヘルプ
page_titleの値はウェブページのHTMLの<title>タグから収集される。通常はタイトルは修正が入るので、いくつものpage_titleの値がデータ上に存在してしまうことになるが、個々のページタイトルによる分析を行うなどでなければ、最新のページタイトルだけが取得できればよいというケースが多い。
GA4SQLのコーディングでは最終的なテーブルにページタイトルをJOINさせることになる。そのため、予めページタイトルを取得するUDFを作成しておき、それを呼び出すだけで結果が得られる状態にしておきたい。
逆に言えば、GA4SQLにおいて重複値があるpage_titleを、例えばpage_locationの代わりのディメンションとしてSQLを組み立てることはない。
JOINする際は、マスターテーブルにページタイトルテーブルをLEFT JOINを「page_location」をキーとし結合させる。ページタイトルテーブルは重複しないため、マスターテーブルの全ての行にページタイトルが紐づくことになる。
以上が、page_titleを取り扱う上での基本的なルールを書き起こしてみた。最新の重複のないpage_titleを取得できるSQLを以下に提示する。noteでリツイートもしくは「Visual SEM Report」の購入後の保護ページにPASSを記載しているので、そちらを張り付けると以下コンテンツの続きが閲覧可能。