Tableauで正規表現とREGEXP関数を使ってみる
前回の記事の内容を踏まえ、実際にスーパーストアのデータで正規表現を使ってみます。
サンプルとしてスーパーストアの「製品名」のデータを使います。
ここでは製品名に「はさみ」か「ナイフ」を含んでいるものを「取り扱い注意」の製品としてわかるようにしていきます。
「はさみ」か「ナイフ」を含む製品だけ区別できるようにしたい。
計算フィールドの作成画面を立ち上げて以下の数式を設定します。
IF REGEXP_MATCH([製品名],'(はさみ|ナイフ)')
THEN "取り扱い注意"
ELSE "その他"
END
ここではREGEXP_MATCH関数を使っています。
正規表現では(はさみ|ナイフ)と記述して「はさみ」か「ナイフ」の文字列を含んでいる文字列を指定し、IFを使って該当するorしないかでそれぞれフラグを立てています。
ここで使っている正規表現の記号「|」はパイプもしくはパイプラインと読み、ORと同じような意味合いを持ちます。括弧と組み併せて使い、括弧の中で複数の文字列を記述することで、いずれかの文字列に該当するパターンを正規表現で表しています。なお、今回は「はさみ」と「ナイフ」の2つですが、パイプを増やすことで3つ以上の文字列を正規表現で指定することも可能です。
作成した計算フィールドをワークシートに出すと以下のようになります。
刃物に該当する製品名は「取り扱い注意」となっている。
正規表現を使ってデータを処理することで、一つ一つの製品名を見て細かく条件を分ける必要なく、一括でデータを処理できていることが確認できます。
まとめ
ここまで、正規表現の概要と、Tableauで関数と組み合わせて使う例を紹介しました。
今回は簡単な例でしたが、正規表現での指定の仕方は非常に多岐にわたります。
最初は記号の種類も多く、少し難しく感じてしまうかもしれませんが、一度慣れてしまうと非常に便利な機能です。マスターするとTableauスキルも飛躍的に向上し、できることの幅も大きく広がるので、是非この機会に使ってみてください。
サムネ画像:piter2121 - stock.adobe.com
新卒でソフトウェアベンダーに入社しBIツールを使ったシステム構築やデータ分析の他、顧客向けのトレーニングやセミナー講師を担当。
その後、WEB系事業会社のWEBマーケティングの担当として新規顧客獲得や広告運用の業務を担当した後ヴァリューズに入社。
現在はお客様が持っているデータを活用してマーケティングの支援を行う他、WEBマーケティングデータとBIツール「Tableau」を組み合わせた新たなサービスの開発にも従事。