Tableauで分析をする前に
こんにちは、船田です!マナミナの企画として、BIツールのTableauを1から教えていただくことになり、その模様を連載でお伝えしています。前回はTableau Desktopのセットアップを行いました。
Tableauのセットアップはどうやればいいの?BI初学者がTableauを1から学びます!【第2回】
https://manamina.valuesccg.com/articles/1151来年から株式会社ヴァリューズに入社予定の船田くんがTableauを1から学んでいきます。講師はTableauの公式パートナーであるヴァリューズで、Tableauセミナーも行っている若林さん。第2回はアカデミックライセンスの取得方法とTableau Desktopツールのセットアップ方法について学びます。Tableauを使って、社内データの活用などを考えている方、ぜひ船田くんと一緒に勉強していきましょう。
そして第3回となる今回は、Tableauで分析をする前に必要となるデータの接続と、分析をする際の基礎知識を学び、実際に簡単なグラフを作成してみます。
いよいよTableauに触れるということで、とても楽しみです!
Tableauへのデータソース接続
若林さん:今回も引き続き、よろしくお願い致します。前回、Tableauのセットアップが完了しましたので、今回は実際にTableauを操作していきたいと思います。
船田:よろしくお願いします!
若林さん:まず、今回の講義で使用するデータの確認をしたいと思います。Tableauには、あらかじめサンプルデータが用意されています。今回の講義では、そのサンプルデータを使用します!
船田:サンプルデータはどこに格納されているのでしょうか?
若林さん:実際にファイルを見ていきましょう。PCによって、格納場所に差異がある可能性がありますが、右上の検索窓で「ja_JP-Japan」を検索してみましょう。
船田:検索しました!いくつかデータが入っているようです。
若林さん:後で使用しますので、上から4番目の「サンプル‐スーパーストア」という名前のExcelファイルを、デスクトップなど自分がわかりやすい場所にコピペしましょう。
船田:コピーできました!
若林さん:それでは、そのExcelのファイルを開いてみましょう。
船田:開きました。
若林さん:このExcelには、スーパーでレジを打つ時などに取得できるPOSデータが入っています。今見ているのは「注文」というシートですが、他にも「返品」や「関係者」といったシートもあり、関連したデータが入っています。今回は、「注文」のシートのみを使用していきます。それでは、Tableau Desktopを開いてください。
船田:わかりました!
若林さん:左側の青い部分に「接続」と書かれていると思います。ここで、どのデータに対して、Tableauに接続を行うか設定することが出来ます。
上半分では「ファイルへ」と書かれていますが、ここではExcelやCSVファイル、他にもAccessと呼ばれるMicrosoftの簡易データベースファイルなどと接続を行うことが出来ます。
その下には「サーバーへ」と書かれています。ここでは、サーバー環境や、Googleスプレッドシートなどのクラウド環境のデータベースと接続を行うことができます。
「サーバーへ」の中の一番下にある「その他…」を押してみてください!
船田:押しました!
若林さん:ここに書かれているのは、Tableauと接続することが出来るデータベースの一覧です。Amazonのクラウド環境である Redshiftをはじめ、Google関連のサービス、昔ながらのOracleのサーバーなど豊富な種類のデータベースを、データソースとして取り込むことが出来ます。
船田:これだけ多くのデータベースと簡単に接続できるのは、とてもありがたいですね。
若林さん:そうですね!それでは、先ほどコピーしたサンプルデータと接続していきましょう。
船田:はい!
若林さん:左側の「ファイルへ」の中の「Microsoft Excel」を押してください。押すとファイルの選択を要求されますので、サンプルデータを選択しましょう。
船田:選択できました!
若林さん:これで接続は完了なのですが、別の接続方法もやってみたいと思いますので、右上の×で閉じてください。
船田:わかりました。
若林さん:サンプルデータが入っているフォルダを開いて、Tableauの中央にサンプルデータをドラック&ドロップしてください。
船田:こんな感じでしょうか?
若林さん:はい、それで大丈夫です!画面が切り替わるので少々お待ちください。
船田:切り替わりました!
若林さん:画面の左側の「シート」と書かれた下に、先ほど確認したサンプルデータの3つのシートが取り込まれていることがわかります。
左の「注文」のシートを上部中央にドラック&ドロップしましょう。
船田:できました!
若林さん:Excelで「注文」のシートを確認した時と同様のものが表示されていると思います。
異なるデータ同士の紐づけも、簡単に行うことが出来ます。「返品」のシートを、同様に上部にドラック&ドロップしてください。
船田:「リレーションシップの編集」というポップアップが出てきました。
若林さん:ここでは、Tableauの中で、どの列を紐づけるのかを自動で判別しています。
船田:自動で判別してくれるのは、非常に助かりますね。
若林さん:他にも、Tableau Desktop内でデータの結合もできますよ。では以上で、基本的なTableauへのデータの接続は完了です。
これ以降で、「返品」のシートは使用しないので、中央の「返品」と書かれたボックスを右クリックで削除しましょう。
船田:わかりました!
Tableauの基礎知識
若林さん:続いて、グラフ作成の前に、Tableauの基礎知識について説明したいと思います。
船田:よろしくお願いします!
若林さん:まずは、Tableauの概念からお話したいと思います。
Tableauの中で一番大きな概念がワークブックです。分析用の画面(ファイル)を作る際に必ず作成されます。
このワークブックの中に、ダッシュボードという単位があります。ダッシュボードはいくつかの表やグラフをまとめたものです。さらに、ダッシュボードの中に個別のワークシートがあります。
船田:ダッシュボードやワークシートは1つの場合もあるのでしょうか?
若林さん:その場合もあります!
また、ワークシートが一つの表やグラフということになるのですが、ワークシートは「ビュー」や「ビズ」と呼ばれることもあります。
船田:名前がなんかかっこいいですね(笑)。
若林さん:続いて、Tableauで扱うファイルについてです。分析用のファイルを作るとワークブックが作成されると先ほど説明しましたが、このワークブックには2種類のファイル形式があります。下の画面を見てみてください。
若林さん:1つ目がワークブック(.twb)で、twbはどのような表やグラフを作るかといった情報は保持していますが、元となるデータソースの情報は持っていません。
一方で、2つ目のパッケージドワークブック(.twbx)は、twbの保有する情報に加え、元となるデータソースの情報も保持しています。
船田:twbでは、元となるデータの保存場所が変わったり、環境が変わったりすると、うまく表やグラフが表示できなくなってしまうということですね。
若林さん:そうなんです。続いて、その下のデータファイルについてですが、TableauはDB(データベース)やファイルからデータを抽出する機能があり、その抽出ファイルのことを指しています。拡張式は.hyperで、古いバージョンだと.tdeとなっていることもあります。
船田:このデータファイルは普通のファイルと何が違うのでしょうか?
若林さん:.hyperはtableau用に最適化されている為、通常のファイルを扱うときに比べ、Tableauのパフォーマンスが向上します。
船田:なるほど。
若林さん:先ほど、Tableauにはデータを抽出する機能があるとお話しましたが、次はその「抽出」とは何かについて説明したいと思います。
若林さん:Tableauのデータとの関係には、「ライブ接続」と「抽出」という2つのパターンがあります。
まず、「ライブ接続」ですが、その名前の通り、リアルタイムでデータソースに接続を行うことです。グラフを作成する際などに、その都度問い合わせを行います。
一方で、「抽出」とは、Tableau専用に最適化されたデータファイル(.hyper)を作成し、その情報を見ることです。
上に書いてあるように、メリットとデメリットはそれぞれあります。
船田:リアルタイム性を重視する場合はライブ接続、パフォーマンスを重視する際は抽出を行うのが良いということですね。
若林さん:その通りです。自分の分析の用途や、目的によって使い分けましょう!
簡単なグラフ作成
若林さん:それでは最後に、サンプルデータの「注文」シートを使って、簡単なグラフを作成してみましょう。
船田:はい!
若林さん:まずは、注文のシートを接続した状態で、左下にあるオレンジ色の「シート1」をクリックしてください。
船田:わかりました。
船田:画面が切り替わりました!
若林さん:左端の「表」と書かれた下に、注文シートの各列名が入っていますが、その列名の並んでいる下のほうを見ると、うっすらと線が引いてあると思います。その線の上と下で表示に違いがあるのですが、船田くんはわかりますか?
船田:上の方は青色になっていて、下のほうは緑色になっています!
若林さん:そうなんです!これはディメンションとメジャーというもので、Tableauが自動で判別し、振り分けをしています。
上の青色がディメンションとなっており、ディメンションは名前や日付などの定性的値が含まれています。つまり、ディメンションは「集計する単位」ということです。
反対に、下の緑色はメジャーとなっており、メジャーは売上や個数など定量的値が含まれます。メジャーは合計や平均、データの件数など数値を集計する項目を指しています。
船田:なるほど!ディメンションは「何の単位(グループ)で集計するか」、メジャーは「何を集計するか」ということですね。
若林さん:そういうことですね!それでは、簡単な時系列の売り上げ推移のグラフを作成してみたいと思います。
ディメンションから「オーダー日」を、上部中央にある「列」の枠内にドラック&ドロップしましょう。
続いて、メジャーから「売上」を、「列」の下にある「行」にドラック&ドロップしてください。
船田:できました!
若林さん:このままだと少し見づらいので、上部右寄りにある「標準」と書かれた場所をクリックし、「ビュー全体」に切り替えましょう。
船田:グラフが見やすくなりました!
若林さん:これで、年毎の売り上げ推移を表すグラフの完成です。シンプルなグラフではありますが、Excelに比べても簡単に直観的な操作でビジュアライズができたと思います。
船田:とっても簡単でした!
第3回のまとめ
第3回の本稿では、Tableauへのデータの接続に始まり、Tableauの基礎知識、簡単なグラフ作成を学びました。
とても簡単にグラフが作ることができて、驚いてしまいました!
さて、次回は、今回よりも難しいグラフの作成方法を学びたいと思います。さらに実践的になっていきますので、今まで以上にTableauの魅力を感じていただけるかと思います。
また次回お会いしましょう!
2021年4月ヴァリューズに新卒入社。
大学でデータ分析について学びながら、ヴァリューズでインターンとして働いていました。