【これだけでOK】Googleアナリティクス(GA)で使える正規表現まとめ【9つに厳選】
GA・GTM
※本サイトはアフィリエイト広告を利用しています。
【正規表現について知りたい人】
「”正規表現”って聞いたことはあるけど、実際どんなものなんだろう。あまりたくさんは覚えられないから、Googleアナリティクス(GA)などの実務でよく使うものをまずは知りたい。」
こういった疑問に答えます。
本記事の内容
この記事を書いている僕は、
元々エンジニアをしており、
現在はWebマーケティング業界で働いています。
そんな僕が、日頃から
Googleアナリティクス(以降、GA)
を使用する中で、知っておくと便利な
『正規表現』についてまとめました。
今は正規表現について
「よく分からない」という方も、
この記事を読みさえすれば
頻出のものをカバーでき、
GAの操作で困らないレベルまで持っていけますよ。
正規表現とは?【”こんな感じ”を表現する記法】
まずは「正規表現ってなに?」
という方に向けて、ざっくり説明すると、以下のような感じ。
正規表現とは、例えば、”郵便番号は「数字3桁-数字4桁」になっているかを確認したい”とか、”URLパラメータがランダムに振られるページの場合に「https://example.com/?random=12345」や「https://example.com/?random=abc」のような、不特定多数の文字列が振られた時でも判別できるようにしたい”など、完全に文字が一致するのではなく、もう少し曖昧な、”こんな感じ”というのを表現したい場合に使える便利な記法。
例えば、上記の
URLパラメータの例の場合、
実務でよく使う正規表現が
『https://example.com/?random=.*』という書き方。
この正規表現の詳細については
あとで詳しく説明するので、ここでは
”正規表現とはどういったものか”
ということだけ分かればOKです。
Googleアナリティクス(GA)でも使える正規表現9選
ではここからは、
具体的な正規表現の種類と、
それぞれの特徴について解説していきます。
今回紹介するのが、以下の9つ。
- その①:ドット『.』
- その②:アスタリスク『*』
- その③:プラス『+』
- その④:キャレット『^』
- その⑤:ドル『$』
- その⑥:クエスチョンマーク『?』
- その⑦:バックスラッシュ(or 円マーク)『\』
- その⑧:バーティカルバー『|』
- その⑨:丸括弧『()』
その①:ドット『.』
ドット『.』の意味は、任意の一文字。
これ単体で使っても良いですが、
後ほど紹介する、アスタリスク『*』や
プラス『+』と組み合わせて、使用することが多いです。
その②:アスタリスク『*』
アスタリスク『*』は、直前の文字の0回以上の繰り返し。
例えば、先ほどのドット『.』と組み合わせて、
g.*le
とした場合、『g』と『le』の間に
任意の文字が0個以上入る
という意味になるので、以下のいずれも該当します。
- gle
- gale
- gooogle
- goggle
0回以上の繰り返しなので、
そこに文字が入らなくても成り立つのがポイントです。
その③:プラス『+』
プラス『+』は、直前の文字の1回以上の繰り返し。
先ほど紹介した
アスタリスク『*』とは少し違い、
1回以上の繰り返し、だという点に注意してください。
g.+le
上記のようにした場合、以下のようなものが該当します。
- gale
- gooogle
必ず1文字以上入る必要があるので、
先ほどのアスタリスク『*』とは違い、
『gle』は該当しない点がポイントです。
その④:キャレット『^』
キャレット『^』は、次の文字で始まるという意味。
- ①:/inquiry/thanks.html
- ②:/services/inquiry/thanks.html
例えば、サイト内に
上記2つのURLが存在し、
①のURLだけを指定したい場合には
以下のように記述をします。
^/inquiry/thanks\.html
上記の記述の中で使用されている
バックスラッシュ(or 円マーク)『\』に関しては、後ほど解説します。
その⑤:ドル『$』
ドル『$』は、前の文字で終わるという意味。
- ①:/thanks.html
- ②:/thanks.html?id=123
例えば、サイト内に
上記2つのURLが存在し、
①のURLだけを指定したい場合には
以下のように記述をします。
/thanks\.html$
その⑥:クエスチョンマーク『?』
クエスチョンマーク『?』は、直前の文字の0回または1回の繰り返し。
ぶっちゃけ、これまでに紹介した
アスタリスク『*』の方が使い勝手が良く、
『繰り返し』の正規表現ではそちらを使うことがほとんど。
しかし、GAではURLパラメーターなどで
クエスチョンマーク『?』をよく使うので、
予想外の挙動を防ぐためにも、ここでは
この『?』が正規表現として使われる記号
だということを、把握しておくことが重要です。
その⑦:バックスラッシュ(or 円マーク)『\』
バックスラッシュ(or 円マーク)
『\』は、“エスケープ”と呼ばれるもので、
直後の文字を正規表現として扱わないという機能を持ちます。
google.com
例えば上記の場合。
先ほど説明したように、ドット『.』は
『任意の一文字』という意味を持つため、
このままでは正規表現の記述の中で
ドメイン名として使うことができません。
ですが、以下の記述に変えることで、
たとえ正規表現の記述の中でも
ドット『.』を文字列として認識してくれるようになります。
google.com // このままでは、ドット『.』が“正規表現”扱いされる
↓
google\.com // こうすることで、ドット『.』が“文字列”扱いされる
このエスケープは非常によく使うので、ぜひ覚えておきましょう。
おまけ:バックスラッシュの入力方法【Macユーザー向け】
「バックスラッシュの正規表現としての意味は分かったけど、そもそもどうやって入力するの、、、」
Windowsユーザーの方に関しては
この疑問を感じる方はいないかもですが、
Macユーザーの方はキーボードの構造上、
このように思われる方もいることでしょう。
結論、『option』キーと『¥』キーを同時に押すだけ。
「ばっくすらっしゅ」と打って変換
をしていたという人は、今日からぜひこの方法を実践してください。
その⑧:バーティカルバー『|』
バーティカルバー『|』は、
『|』の前後の文字列のいずれか片方
という意味があり、つまりOR条件として利用されます。
google | apple
例えば、上記のように指定した場合、以下のいずれかが該当します。
- apple
その⑨:丸括弧『()』
丸括弧『()』は、
()内の文字を1つのグループにまとめる働きがあります。
文章だけだと分かりづらいので、以下に例を記載します。
g(al | oogl)e
例えば、先ほど紹介した
バーティカルバー『|』と組み合わせて
上記のように指定した場合、以下のいずれかが該当します。
- gale
まとめ:GAで使える正規表現
最後に、今回紹介した正規表現の復習です。
- ドット『.』:任意の一文字
- アスタリスク『*』:直前の文字の0回以上の繰り返し
- プラス『+』:直前の文字の1回以上の繰り返し
- キャレット『^』:次の文字で始まる
- ドル『$』:前の文字で終わる
- クエスチョンマーク『?』:直前の文字の0回または1回の繰り返し
- バックスラッシュ(or 円マーク)『\』:直後の文字をエスケープ
- バーティカルバー『|』:OR条件
- 丸括弧『()』:グループ化の役割
正規表現には、上記の他にも
まだまだたくさんの種類がありますが、
今回紹介したものを覚えておけば、
GAの基本の設定・操作ではほとんど通用します。
とりあえずは、まずこの9つを覚え、
必要に応じて徐々に幅を広げていきましょう😌