正規表現とは?
正規表現(regular expression)とは、文字列と記号を組み合わせて、あいまいな条件でデータの検索や指定を行うための表現(記述)方法です。
例えば「47都道府県名の中から『山』か『川』の文字が含まれるデータを抜き出して欲しい」と言う要件があった際、正規表現を知らないと一つ一つのデータを確認する必要がある上に、確認漏れなどミスが発生してしまう可能性があります。
一方で正規表現を使うことで上記のような曖昧な条件でも機械的に一括で処理できるため、ミスなどの心配もなく短時間で処理ができます。
正規表現の書き方については既に詳細を解説している記事がいくつもあるので、ここでの紹介は割愛しますが、とても奥が深い世界なので興味のある方は是非ご自身でも調べてみていただければと思います。
REGEXP○○関数とは?
REGEXP○○関数とは、正規表現の英語表記(regular expression)の頭文字から取ったTableauで用意されている正規表現処理用の関数です。
以下の4種類が用意されており、それぞれできることが少し違います。
・REGEXP_REPLACE(対象のデータ, 正規表現, 置換した後の文字列)
対象のデータの中で、正規表現に該当した文字列を他の文字列に置換します。
・REGEXP_MATCH(対象のデータ, 正規表現)
対象のデータの中で、正規表現に該当する文字列を持っているか判定します。
判定結果は真or偽で返されるため、IFと組み合わせて使うのが普通です。
・REGEXP_EXTRACT(対象のデータ, 正規表現)
対象のデータの中で、正規表現に該当した文字列を抽出します。
・REGEXP_EXTRACT_NTH(対象のデータ, 正規表現,n)
REGEXP_EXTRACTの派生形で、抽出する文字列グループの位置を指定します。
次の記事では、実際にTableauの中で正規表現を使ってデータを加工し、使い方のイメージを確認していきます。
サムネ画像:piter2121 - stock.adobe.com
新卒でソフトウェアベンダーに入社しBIツールを使ったシステム構築やデータ分析の他、顧客向けのトレーニングやセミナー講師を担当。
その後、WEB系事業会社のWEBマーケティングの担当として新規顧客獲得や広告運用の業務を担当した後ヴァリューズに入社。
現在はお客様が持っているデータを活用してマーケティングの支援を行う他、WEBマーケティングデータとBIツール「Tableau」を組み合わせた新たなサービスの開発にも従事。