データ分析の目的を明確にして適切な手法を用いるには
業務のスピードアップ、効率化を目指すには、担当者レベルでデータ分析を行えるのが理想的です。そのためには、先に挙げた分析方法それぞれの特徴を把握し、適切な場面で用いなければなりません。以下、それぞれのデータ分析手法について解説します。
マーケティングのデータ分析に使われる手法との基礎固めにおすすめの本9冊
https://manamina.valuesccg.com/articles/1013膨大なデジタルデータが集まる現代では、経営やマーケティング施策の意思決定に「データ分析」を活用する企業が増えています。企業あるいは現場でデータを収集・分析・活用するために参考となる本をご紹介します。また、データ分析に使われる代表的な手法についてもまとめました。
アンケート分析の基本「クロス集計」
クロス集計は、アンケートの設問に対し、回答者の属性をかけ合わせて集計するデータ分析手法です。
例えば、「サービスの満足度は?」というアンケートを実施(回答者は男女それぞれ200名で合計400名)したとします。
サービスの満足度に性別というユーザーの属性をかけ合わせると、属性ごとの平均値を算出できます。
満足している | どちらとも言えない | 不満 | |
---|---|---|---|
男性 | 100名(50.0%) | 60名(30.0%) | 40名(20.0%) |
女性 | 80名(40.0%) | 50名(25.0%) | 70名(35.0%) |
全体 | 180名(45.0%) | 110名(27.5%) | 110名(27.5%) |
分析結果が視覚的にわかりやすい、エクセルなどの表計算ソフトで手軽に集計結果を得られるメリットがある一方、1つのカテゴリーのサンプル数(n)は、最低でも30件は必要とされているので、注意が必要です。
事象の発生確率を測る「ロジスティック回帰分析」
ロジスティック回帰分析とは、ある事象の発生確率を複数の要因と組み合わせて分析する多変量解析の一種で、ある事象の発生率を算出する方法です。
よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。
それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。
このような分析以外にも、ロジスティック回帰分析は、災害の発生、顧客がDMに反応するか否かなど、幅広い分野で活用できるデータ分析手法とされています。
ロジスティック回帰分析の計算はエクセルのほか、統計解析フリーソフト「R」でも行えます。
関連性の発見に役立つ「アソシエーション分析」
「Aという商品を購入する人の○割が、Bという商品を購入する」という関連を分析する手法が、アソシエーション分析です。
もともとは店舗で使われている「POS(point of sales)データ」を分析するために開発されたデータ分析手法で、膨大なデータの中から関連性のあるものを抽出します。
抽出したルールには3つの指標があります。
支持度(support)
「商品Aを買う人が商品Bも買う」というルールが出現する割合
信頼度(confidence)
商品Aと商品Bの関連の強さ
リフト値(lift)
全体において、商品Aと商品Bを購入した人の割合
アソシエーション分析の有名な事例として、スーパーにおむつ(商品A)を買いにきた男性の多くが一緒にビール(商品B)も買う、というものがあります。買い物データの中からおむつを購入した人とビールを購入した人のデータをがあるとします。
全体的な数値として、おむつとビールを同時に購入する割合(リフト値)が低くても、おむつを購入した人がビールも購入した割合(支持度)が高ければ、おむつとビールの購入率には強い関連性(信頼度)がある、となります。
支持度、信頼度、リフト値はいずれもエクセルで算出可能です。
リスクマネジメントにも活用できる「決定木分析」
アンケート結果をもとに、「もし〜だったらどうなるか?」という仮定を何度も繰り返し、ツリー構造(樹形図)にして結果を複数パターン予測するのが、決定木分析です。
分岐点で複雑かつ多様な要因を整理・分析できるほか、分岐での確率も算出できるのが特徴です。
そのため、自社製品やサービス購入見込みが最も高い人物を探るなどの目的で使われるほか、金融機関においては顧客属性別の貸し倒れリスクの算出、工場での生産管理システムでの不良品発生率の予測といった、リスクマネジメントのためにも利用されています。
決定木作成にあたっては、エクセルのほか「edraw」といったツールも利用できます。
ユーザーのセグメンテーションなどに利用する「クラスター分析」
クラスター分析とは、異なるデータの集合体から類似するデータを集めてグルーピング(クラスター作成)し、その属性や特徴を分析する手法です。
分類の形式として、以下の2つの分析方法が用いられます。
階層的クラスター分析
類似するデータをクラスター化する手法で、過程が階層のようになり、最後は樹形図が完成します。類似性の近いものからクラスターを作成すればよいので、初めにクラスターの数を決める必要はありません。
非階層的クラスター分析
あらかじめクラスター化する数を決め、その中にサンプルを分けていく手法です。サンプル数が多い場合に適しています。
こうした分析から、セグメンテーションされたユーザーに対しての効果的なアプローチ方法の模索を行います。
なお、クラスター分析の事例は以下のリンクで紹介しているので、ぜひご参考ください。
Web行動ログデータを用いたクラスタリングとは?分析手法と事例を公開!
https://manamina.valuesccg.com/articles/639マーケティングの分析で時々出てくる「クラスタ」や「クラスタリング」。聞いたことはあるけれど、何がわかるの?メリットやデメリットは?…など、疑問も多いのではないでしょうか。本資料では、アンケートを用いた従来のクラスタリングのメリット・デメリットをまずおさえ、新しい手法として注目を集めているWeb行動ログデータを使ったクラスタリングについて、アウトプットや活用事例を解説します。
まとめ
収集したデータは、分析して初めてその効果を発揮します。とはいえ、分析しただけでは無意味です。データ分析から意思決定の判断材料を掘り起こさなければなりません。よって、データ分析は、その結果をビジネス戦略を浮き彫りにするためのツールである、と認識しておく必要があります。
メールマガジン登録
最新調査やマーケティングに役立つ
トレンド情報をお届けします
マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。
編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。