Tableau研修に潜入
こんにちは、マナミナ編集部の弥富です。新卒社員向けのTableau研修ウェビナーに潜入しています。
前回の記事では、そもそもBIとは何か、そしてTableauとはどんなツールで何ができるのかについて学んだところでした。
Tableauでのデータ可視化って何がすごいの? 新卒社員向けオンライン研修に潜入しました
https://manamina.valuesccg.com/articles/859ヴァリューズも導入支援をしているBIツール「Tableau」を学ぶ新卒向けウェビナーに編集部が潜入。そもそもBIとは何か、Tableauで何ができるのかを学びました。
BIとは「データ分析を経営の意思決定に活用するコンセプト」のこと。そしてそのためのBIツール「Tableau」は、データの専門家でなくても操作が容易で導入も簡単、データ可視化による意思決定までのスピードも速い、といった点が魅力だと分かりました。
前回の研修ではTableauの基本概念やできることを学びましたが、今回はTableauの基本用語や機能を学びます。初心者には一見つまずきやすい用語を整理することで、Tableauの理解を一歩進めることが目標。では早速内容をレポートしていきます。
TableauとExcelの違い
今回の講師を担当するのはヴァリューズの高木誠二さん。データ分析業務に携わっており、ふだんからTableauを駆使している若手データアナリストです。
ウェビナーの様子。講師はデータアナリストの高木誠二さん
まずTableauの概要をもう一度つかむため、Excelとの違いに触れながら解説します。
Excelはみなさんご存知の表計算ツール。元データを直接編集したり、気軽にデータ集計できたりすることから、広くビジネスパーソンに使用されています。
しかしExcelの問題点として、数十MBのデータを扱うと動作が不安定になることがありますし、複数のデータソースの接続ができません。デジタル時代のビッグデータを処理したいときは大容量のファイルを複数扱うこともしばしばで、データ分析やグラフ化がままならなくなる場合もあるでしょう。
一方Tableauはデータを可視化するのが得意なツール。「感覚的には〜2GB程度のデータであればさくさくと操作可能」と高木さんは言います。
Tableauは複数の大容量ファイルを用いたデータ集計・分析する場合も高速に処理することができます。グラフ化によるデータ分析、そしてビジネス上の意思決定につなげられる部分で、データを駆使する必要があるデジタル時代に大助かりのBIツールなのです。
Tableauで使われる基本用語
さて、ここからはTableau内で使われる基本ワードについて、実際のTableau画面を例に出しながら解説していきます。
■ディメンションとメジャー
まずは「ディメンション」「メジャー」の2つの用語について。ディメンションとは集計軸にしたい指標、メジャーとは集計対象にしたい指標のことを指しています。実際の例で確認してみましょう。
上の図内の表は、簡易的なWebログデータをイメージしています。固有のIDを持つユーザーが、ECサイトを訪れた日付やPVが記録されているとします。
このデータセットに対して、ユーザーIDごとのPV数を集計したいとしましょう。このとき集計軸は「userid」、集計対象は「PV数」となります。Tableauでは、この集計軸のことを「ディメンション」、集計対象のことを「メジャー」という名前で表すことになっているのです。
さて、ではこの集計を実際にTableau上で行うとどうなるでしょうか。まず、今回の簡易データファイルをTableauにドラッグ&ドロップして読み込ませます。
すると、上の図の左カラムのようにディメンションとメジャーにそれぞれ指標が分類されました。
Tableauではこれらの指標をドラッグ&ドロップすることでグラフの作成を行います。試しにディメンション欄の「userid」を「行」に、メジャー欄の「pv」を「列」にドラッグ&ドロップすると…。
シート1に棒グラフが表示されました。もっとも簡易的なTableauでのデータ可視化です。
■計算フィールドの追加
次は「計算フィールド」の追加について解説します。
計算フィールドとは、求める分析のために追加する列のこと。新しい集計の軸または指標を追加するイメージです。これも具体例で理解していきましょう。
上の表は、先ほどのWebログデータに「timeOnSite」、つまりサイト滞在時間が加わったデータセットです。このようなデータについて、すぐサイトを離脱してしまった、滞在時間が0のデータを除いて分析したい、と思う場合があります。
しかし上のデータでは、分析に必要なフィールド(=列)が含まれていません。そうなるとTableau上では直帰セッションを除いたデータのみの分析ができません。
そこで、新たに計算フィールドを追加する必要が出てきます。その際、Tableauでは次のような計算式を使います。
if timeOnSite == 0 then 1
else 0
end
計算式の意味としては、「もしtimeOnSiteが0だったら1を入力する。それ以外は0を入力する」というもの。実行すると次のように列が追加されます。
実際にTableau上で計算フィールドを追加する場合は、下の図のように「分析」→「計算フィールドの作成」から行います。
すると、左カラムのメジャーの欄に新しい指標が追加されます。この指標を先ほどと同じようにドラッグ&ドロップすれば集計対象としてグラフ化することができます。
■ワークブックとダッシュボード
Tableau内の「ワークブック」と「ワークシート」、「ダッシュボード」などの概念の関係性を理解しておきましょう。包含関係は次のような図になります。
Tableauではワークブックが一番大きな概念となっています。ひとつのワークブックの中には複数のダッシュボードが含まれており、さらにその中に複数のワークシートが含まれている、という関係。そして数表やグラフがひとつのワークシートを構成しています。
例えばWebログデータからサイト改善のための意思決定を導きたいときは、いろいろな観点からデータ分析を行うはず。ここまでで1人あたりのPV数やサイト滞在時間の例を出しましたが、これらの複数ワークシートをダッシュボードとして1枚にまとめることで、多角的な視点から分析が可能になります。
グラフ同士の関係性やまとめ方、見せ方がデータから仮説を導くときの重要なポイントです。基本概念としてこれらの用語を抑えておくべきでしょう。
まとめ
最後に研修の内容を簡単に振り返ります。
TableauとExcelの違い
Excelはデータ書き換えができ、表計算が直感的に行えるが、ファイルサイズが数十MB以上では動作が不安定になり、さらにデータの可視化が苦手。一方、Tableauは複数の大容量ファイルにおけるデータ集計・分析する場合も高速に処理することができ、さらにデータの可視化が得意。
ディメンションとメジャー
ディメンションは集計軸、メジャーは集計対象のことを指す。
計算フィールドの追加
元データから新しい列を作り、指標を追加すること。If文などの計算式を入力する必要がある。
ワークブック・ダッシュボード・ワークシート
ワークシートが最小単位。複数ワークシートをまとめて1つのダッシュボードを作り、データを眺めて分析する流れ。
新卒社員向けTableau研修のレポートはこれで終了です。これまで名前はよく耳にしていたTableauでしたが、あらためてツールの中身がどんなふうになっているのか、理解が深まりました。
前回の記事と合わせて、BIツールとは何か、Tableauとは何か、またその機能や基本用語などを学んできました。しかしもっとも重要なのは、どのような指標を用いて、どのような切り口でデータを見ていくべきか、ということでしょう。そしてそこから仮説を生み出し、ビジネス上の改善に結びつけていくことがBIの本質です。
本サイト・マナミナではデータ分析の事例やノウハウを紹介していますので、ぜひ参考にしていただければと思います。また、ヴァリューズでは自社データ分析の支援やTableauの導入支援を行っております。気になる方は下記からお問い合わせください。
株式会社ヴァリューズは、「Tableau」公式パートナーです
マナミナ編集部でデスクを担当しています。新卒でメディア系企業に入社後、フリーランスの編集者・ライターとして独立。マナミナでは主にデータを活用した取り組み事例の取材記事を執筆しています。