クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

企業がデータを活用するにあたっては、現場でデータ分析できる人材が増えることが重要です。分析したいときに他部署や外部に依頼せず、自分でデータ分析できれば、より素早く結果を得られます。また、外部に依頼した場合でも、分析に用いられている手法を理解し、分析の目的と合っているか判断する必要があります。そのためには「クロス集計」「ロジスティック回帰分析」「アソシエーション分析」「決定木分析」「クラスター分析」など、主要なデータ分析手法の基礎知識を身につけておきましょう。


データ分析の目的を明確にして適切な手法を用いるには

業務のスピードアップ、効率化を目指すには、担当者レベルでデータ分析を行えるのが理想的です。そのためには、先に挙げた分析方法それぞれの特徴を把握し、適切な場面で用いなければなりません。以下、それぞれのデータ分析手法について解説します。

アンケート分析の基本「クロス集計」

クロス集計は、アンケートの設問に対し、回答者の属性をかけ合わせて集計するデータ分析手法です。

例えば、「サービスの満足度は?」というアンケートを実施(回答者は男女それぞれ200名で合計400名)したとします。

サービスの満足度に性別というユーザーの属性をかけ合わせると、属性ごとの平均値を算出できます。

満足している どちらとも言えない 不満
男性 100名(50.0%) 60名(30.0%) 40名(20.0%)
女性 80名(40.0%) 50名(25.0%) 70名(35.0%)
全体 180名(45.0%) 110名(27.5%) 110名(27.5%)

分析結果が視覚的にわかりやすい、エクセルなどの表計算ソフトで手軽に集計結果を得られるメリットがある一方、1つのカテゴリーのサンプル数(n)は、最低でも30件は必要とされているので、注意が必要です。

事象の発生確率を測る「ロジスティック回帰分析」

ロジスティック回帰分析とは、ある事象の発生確率を複数の要因と組み合わせて分析する多変量解析の一種で、ある事象の発生率を算出する方法です。

よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。

それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。

このような分析以外にも、ロジスティック回帰分析は、災害の発生、顧客がDMに反応するか否かなど、幅広い分野で活用できるデータ分析手法とされています。

ロジスティック回帰分析の計算はエクセルのほか、統計解析フリーソフト「R」でも行えます。

関連性の発見に役立つ「アソシエーション分析」

「Aという商品を購入する人の○割が、Bという商品を購入する」という関連を分析する手法が、アソシエーション分析です。

もともとは店舗で使われている「POS(point of sales)データ」を分析するために開発されたデータ分析手法で、膨大なデータの中から関連性のあるものを抽出します。

抽出したルールには3つの指標があります。

支持度(support)
「商品Aを買う人が商品Bも買う」というルールが出現する割合

信頼度(confidence)
商品Aと商品Bの関連の強さ

リフト値(lift)
全体において、商品Aと商品Bを購入した人の割合

アソシエーション分析の有名な事例として、スーパーにおむつ(商品A)を買いにきた男性の多くが一緒にビール(商品B)も買う、というものがあります。買い物データの中からおむつを購入した人とビールを購入した人のデータをがあるとします。

全体的な数値として、おむつとビールを同時に購入する割合(リフト値)が低くても、おむつを購入した人がビールも購入した割合(支持度)が高ければ、おむつとビールの購入率には強い関連性(信頼度)がある、となります。

支持度、信頼度、リフト値はいずれもエクセルで算出可能です。

リスクマネジメントにも活用できる「決定木分析」

アンケート結果をもとに、「もし〜だったらどうなるか?」という仮定を何度も繰り返し、ツリー構造(樹形図)にして結果を複数パターン予測するのが、決定木分析です。

分岐点で複雑かつ多様な要因を整理・分析できるほか、分岐での確率も算出できるのが特徴です。

そのため、自社製品やサービス購入見込みが最も高い人物を探るなどの目的で使われるほか、金融機関においては顧客属性別の貸し倒れリスクの算出、工場での生産管理システムでの不良品発生率の予測といった、リスクマネジメントのためにも利用されています。

決定木作成にあたっては、エクセルのほか「edraw」といったツールも利用できます。

ユーザーのセグメンテーションなどに利用する「クラスター分析」

クラスター分析とは、異なるデータの集合体から類似するデータを集めてグルーピング(クラスター作成)し、その属性や特徴を分析する手法です。

分類の形式として、以下の2つの分析方法が用いられます。

階層的クラスター分析
類似するデータをクラスター化する手法で、過程が階層のようになり、最後は樹形図が完成します。類似性の近いものからクラスターを作成すればよいので、初めにクラスターの数を決める必要はありません。

非階層的クラスター分析
あらかじめクラスター化する数を決め、その中にサンプルを分けていく手法です。サンプル数が多い場合に適しています。

こうした分析から、セグメンテーションされたユーザーに対しての効果的なアプローチ方法の模索を行います。

なお、クラスター分析の事例は以下のリンクで紹介しているので、ぜひご参考ください。

Web行動ログデータを用いたクラスタリングとは?分析手法と事例を公開!

https://manamina.valuesccg.com/articles/639

マーケティングの分析で時々出てくる「クラスタ」や「クラスタリング」。聞いたことはあるけれど、何がわかるの?メリットやデメリットは?…など、疑問も多いのではないでしょうか。本資料では、アンケートを用いた従来のクラスタリングのメリット・デメリットをまずおさえ、新しい手法として注目を集めているWeb行動ログデータを使ったクラスタリングについて、アウトプットや活用事例を解説します。

まとめ

収集したデータは、分析して初めてその効果を発揮します。とはいえ、分析しただけでは無意味です。データ分析から意思決定の判断材料を掘り起こさなければなりません。よって、データ分析は、その結果をビジネス戦略を浮き彫りにするためのツールである、と認識しておく必要があります。

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


データ分析

関連する投稿


データに基づく意思決定!マーケティングに効くデータ分析とは

データに基づく意思決定!マーケティングに効くデータ分析とは

複雑かつ大量のデータを容易に収集できる現代では、データに基づくマーケティングが盛んになっています。集めたデータは分析して初めて、企業の意思決定に使える「生きたデータ」になります。マーケティングにおけるデータ分析の方法や具体的な事例、参考になる書籍を紹介します。


データ分析の基礎固めにおすすめの本8冊

データ分析の基礎固めにおすすめの本8冊

膨大なデジタルデータが集まる現代では、経営やマーケティング施策の意思決定にデータ分析を活用する企業が増えています。企業あるいは現場でデータを収集・分析・活用するために参考となる本をご紹介します。


最新の投稿


「メディア戦略の骨はチャネル構成」All Aboutが他メディアとの比較分析から新規事業を立ち上げる方法とは

「メディア戦略の骨はチャネル構成」All Aboutが他メディアとの比較分析から新規事業を立ち上げる方法とは

月間2000万人以上の読者を集める国内最大規模の生活総合情報サイト「All About」を中心とし、多様なメディアを運営する株式会社オールアバウト。同社ではWeb行動ログ分析ツール「<a href="https://www.valuesccg.com/service/emarkplus/" target="_blank">eMark+</a>」を活用し、市場ニーズの分析や新規事業の戦略策定につなげていると言います。メディアビジネス部のジェネラルマネジャー・徳永さんに、All Aboutの戦略設計やデータ活用をお聞きしました。


Webで消費者とのコミュニケーションに成功したサイトは…?公式note活用のLINE、ギフトマーケティングも台頭【20年9月急上昇サイト】

Webで消費者とのコミュニケーションに成功したサイトは…?公式note活用のLINE、ギフトマーケティングも台頭【20年9月急上昇サイト】

2020年9月にユーザー数を伸ばしたWebサイトは? SaaS型の市場分析ツール「<a href="https://www.valuesccg.com/service/emarkplus/" target="_blank">eMark+(イーマークプラス)</a>」を使うと、どんな人がどんなWebサイトを見ているのか、いろいろな切り口で簡単に調べることができます。今回はeMark+を使って訪問ユーザー数の前月比が急上昇したWebサイトを調査しました。


ライバル企業も徹底分析!誰でも手軽に始められる『Dockpit(ドックピット)』の競合分析機能まとめ

ライバル企業も徹底分析!誰でも手軽に始められる『Dockpit(ドックピット)』の競合分析機能まとめ

ヴァリューズが開発し2020年10月に正式リリースしたダッシュボード型マーケティングツール『Dockpit(ドックピット)』にはキーワード分析、競合分析、業界分析、トレンド分析の4つの機能が備わっています。今回は「競合分析」に着目し、Webサイトの競合分析の流れから活用方法まで詳しくご紹介します。


中国でもミニマリストが増加。その理由とは|中国トレンド調査

中国でもミニマリストが増加。その理由とは|中国トレンド調査

「ミニマリスト」とは最小限(ミニマル)の物で暮らす人を意味しますが、アートトレンドの一つとして、必要不可欠な要素も含め全てを剥ぎ取る「ミニマリストデザイン」と呼ばれるものが存在します。禅と簡素さに満ちた日本のデザインやホワイトインテリアが有名な北欧がその代表例として挙げられます。中国でも、日本と北欧からの影響を受け、シンプルなデザインに憧れ、「モノを手放そう」というミニマリスト志向を持つ人が増えてきています。ここでは、衣食住の観点から中国の「ミニマリスト」について考察していきたいと思います。


急上昇ワードに“鬼滅の刃 映画”“IPHONE12”など...「週間」検索キーワードランキング(2020/10/11~2020/10/17)

急上昇ワードに“鬼滅の刃 映画”“IPHONE12”など...「週間」検索キーワードランキング(2020/10/11~2020/10/17)

2020年10月11日~10月17日週の検索急上昇ワードでは、10月16日に公開され初日から観客動員数91万人と大ヒットで注目を集める「鬼滅の刃 映画」や、Appleが10月16日に予約を開始した「iPhone12」などの検索が急増。「全国の30万人規模のモニター会員の協力により、ネット行動ログとユーザー属性情報を用いたマーケティング分析サービス「VALUES eMark+」を使用し、検索キーワードランキングを作成しました。


自社と競合サイトのユーザー層の違いや急上昇サイトがすぐにわかる!他社サイトのユーザーが見える市場調査ツール eMark+無料登録はこちら

アクセスランキング


>>総合人気ランキング