クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

企業がデータを活用するにあたっては、現場でデータ分析できる人材が増えることが重要です。分析したいときに他部署や外部に依頼せず、自分でデータ分析できれば、より素早く結果を得られます。また、外部に依頼した場合でも、分析に用いられている手法を理解し、分析の目的と合っているか判断する必要があります。そのためには「クロス集計」「ロジスティック回帰分析」「アソシエーション分析」「決定木分析」「クラスター分析」など、主要なデータ分析手法の基礎知識を身につけておきましょう。


データ分析の目的を明確にして適切な手法を用いるには

業務のスピードアップ、効率化を目指すには、担当者レベルでデータ分析を行えるのが理想的です。そのためには、先に挙げた分析方法それぞれの特徴を把握し、適切な場面で用いなければなりません。以下、それぞれのデータ分析手法について解説します。

マーケティングのデータ分析に使われる手法との基礎固めにおすすめの本9冊

https://manamina.valuesccg.com/articles/1013

膨大なデジタルデータが集まる現代では、経営やマーケティング施策の意思決定に「データ分析」を活用する企業が増えています。企業あるいは現場でデータを収集・分析・活用するために参考となる本をご紹介します。また、データ分析に使われる代表的な手法についてもまとめました。

アンケート分析の基本「クロス集計」

クロス集計は、アンケートの設問に対し、回答者の属性をかけ合わせて集計するデータ分析手法です。

例えば、「サービスの満足度は?」というアンケートを実施(回答者は男女それぞれ200名で合計400名)したとします。

サービスの満足度に性別というユーザーの属性をかけ合わせると、属性ごとの平均値を算出できます。

満足している どちらとも言えない 不満
男性 100名(50.0%) 60名(30.0%) 40名(20.0%)
女性 80名(40.0%) 50名(25.0%) 70名(35.0%)
全体 180名(45.0%) 110名(27.5%) 110名(27.5%)

分析結果が視覚的にわかりやすい、エクセルなどの表計算ソフトで手軽に集計結果を得られるメリットがある一方、1つのカテゴリーのサンプル数(n)は、最低でも30件は必要とされているので、注意が必要です。

事象の発生確率を測る「ロジスティック回帰分析」

ロジスティック回帰分析とは、ある事象の発生確率を複数の要因と組み合わせて分析する多変量解析の一種で、ある事象の発生率を算出する方法です。

よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。

それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。

このような分析以外にも、ロジスティック回帰分析は、災害の発生、顧客がDMに反応するか否かなど、幅広い分野で活用できるデータ分析手法とされています。

ロジスティック回帰分析の計算はエクセルのほか、統計解析フリーソフト「R」でも行えます。

関連性の発見に役立つ「アソシエーション分析」

「Aという商品を購入する人の○割が、Bという商品を購入する」という関連を分析する手法が、アソシエーション分析です。

もともとは店舗で使われている「POS(point of sales)データ」を分析するために開発されたデータ分析手法で、膨大なデータの中から関連性のあるものを抽出します。

抽出したルールには3つの指標があります。

支持度(support)
「商品Aを買う人が商品Bも買う」というルールが出現する割合

信頼度(confidence)
商品Aと商品Bの関連の強さ

リフト値(lift)
全体において、商品Aと商品Bを購入した人の割合

アソシエーション分析の有名な事例として、スーパーにおむつ(商品A)を買いにきた男性の多くが一緒にビール(商品B)も買う、というものがあります。買い物データの中からおむつを購入した人とビールを購入した人のデータをがあるとします。

全体的な数値として、おむつとビールを同時に購入する割合(リフト値)が低くても、おむつを購入した人がビールも購入した割合(支持度)が高ければ、おむつとビールの購入率には強い関連性(信頼度)がある、となります。

支持度、信頼度、リフト値はいずれもエクセルで算出可能です。

リスクマネジメントにも活用できる「決定木分析」

アンケート結果をもとに、「もし〜だったらどうなるか?」という仮定を何度も繰り返し、ツリー構造(樹形図)にして結果を複数パターン予測するのが、決定木分析です。

分岐点で複雑かつ多様な要因を整理・分析できるほか、分岐での確率も算出できるのが特徴です。

そのため、自社製品やサービス購入見込みが最も高い人物を探るなどの目的で使われるほか、金融機関においては顧客属性別の貸し倒れリスクの算出、工場での生産管理システムでの不良品発生率の予測といった、リスクマネジメントのためにも利用されています。

決定木作成にあたっては、エクセルのほか「edraw」といったツールも利用できます。

ユーザーのセグメンテーションなどに利用する「クラスター分析」

クラスター分析とは、異なるデータの集合体から類似するデータを集めてグルーピング(クラスター作成)し、その属性や特徴を分析する手法です。

分類の形式として、以下の2つの分析方法が用いられます。

階層的クラスター分析
類似するデータをクラスター化する手法で、過程が階層のようになり、最後は樹形図が完成します。類似性の近いものからクラスターを作成すればよいので、初めにクラスターの数を決める必要はありません。

非階層的クラスター分析
あらかじめクラスター化する数を決め、その中にサンプルを分けていく手法です。サンプル数が多い場合に適しています。

こうした分析から、セグメンテーションされたユーザーに対しての効果的なアプローチ方法の模索を行います。

なお、クラスター分析の事例は以下のリンクで紹介しているので、ぜひご参考ください。

Web行動ログデータを用いたクラスタリングとは?分析手法と事例を公開!

https://manamina.valuesccg.com/articles/639

マーケティングの分析で時々出てくる「クラスタ」や「クラスタリング」。聞いたことはあるけれど、何がわかるの?メリットやデメリットは?…など、疑問も多いのではないでしょうか。本資料では、アンケートを用いた従来のクラスタリングのメリット・デメリットをまずおさえ、新しい手法として注目を集めているWeb行動ログデータを使ったクラスタリングについて、アウトプットや活用事例を解説します。

まとめ

収集したデータは、分析して初めてその効果を発揮します。とはいえ、分析しただけでは無意味です。データ分析から意思決定の判断材料を掘り起こさなければなりません。よって、データ分析は、その結果をビジネス戦略を浮き彫りにするためのツールである、と認識しておく必要があります。

​​

メールマガジン登録

最新調査やマーケティングに役立つ
トレンド情報をお届けします

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


データ分析

関連する投稿


個人申込は11月6日(日)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2022年度秋

個人申込は11月6日(日)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2022年度秋

企業におけるデータ活用やDX推進の人材ニーズが高まる中で、今後非常に伸びていく資格試験として注目を集めているのが、一般社団法人 データサイエンティスト協会が主催する「データサイエンティスト検定™(DS検定★)」です。全国各地の試験会場で受験でき、2022年度秋の試験実施期間は2022年11月15日(火)~12月5日(月)を予定しています。個人申込みは2022年11月6日(日)まで。データサイエンティストを目指す方やデータ人材としてキャリアアップしたい方にとって重要なDS検定、ぜひこの機会にチャレンジしてみてはいかがでしょうか。


仮説のレベルを一段上げる。電通の分析ツール活用法 |「VALUES Marketing Dive」レポート

仮説のレベルを一段上げる。電通の分析ツール活用法 |「VALUES Marketing Dive」レポート

ヴァリューズは、“データを通じて顧客のことを深く考える”、“マーケティングの面白さに熱中する”という意味を込め、マーケティングイベント「VALUES Marketing Dive」を5/26に開催しました。本セミナーの全体テーマは「Update Your Marketing」。これからの時代、生活者には新たな価値観や購買行動が生まれ、マーケティング戦略や施策はさらなるアップデートが求められます。本講演では電通のプランナーをお迎えし、「仮説のレベルを一段上げる Dockpit活用法」と題して、リアルな声をふまえたツール活用法をご紹介いただきました。


DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは? | 「VALUES Marketing Dive」レポート

DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは? | 「VALUES Marketing Dive」レポート

ヴァリューズは、“データを通じて顧客のことを深く考える”“マーケティングの面白さに熱中する”という意味を込め、新しいマーケティングイベント「VALUES Marketing Dive」を5月26日に開催しました。本セミナー全体のテーマは「Update Your Marketing」。Withコロナ時代、生活者には新たな価値観や消費行動が生まれ、マーケティング戦略や施策においては、さらなるアップデートが求められています。本講演では、『DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは』と題し、キーノートをお届けしました。


「データ分析」の理解に役立つ事例集

「データ分析」の理解に役立つ事例集

マーケティングにおけるデータ活用、そしてデータ分析の重要性は日に日に増しています。マナミナにもたくさんあるデータ分析に関連する記事を、これからデータ分析を始めたいという方に向けてまとめてみました。様々な事例を見て、データ分析のイメージをつかみましょう。


マーケティングの基礎知識!データ分析の「回帰分析」とは?

マーケティングの基礎知識!データ分析の「回帰分析」とは?

商品の需要予測やプロモーションするとどのくらい来店者数が増えるかなど、ある結果に対する要因を推測するために数式化する「回帰分析」。IT技術の発展で集まった大量のデータは「回帰分析」などの統計手法でデータ分析され、マーケティングに活用されています。


最新の投稿


タイパとは?Z世代が重視する「タイパ至上主義」の背景とマーケティング事例

タイパとは?Z世代が重視する「タイパ至上主義」の背景とマーケティング事例

Z世代は、生活のあらゆる場面でタイパ(タイムパフォーマンス)を意識しています。「タイパ至上主義」という言葉が登場するほど、Z世代は時間効率を重視しているのです。この記事では、Z世代の購買心理・最新のトレンドを知るために、タイパの概要や価値観、マーケティング事例を解説します。


2022年中国の「独身の日=ダブルイレブン」商戦。最新のトレンド業界は?

2022年中国の「独身の日=ダブルイレブン」商戦。最新のトレンド業界は?

ダブルイレブン(W11)とは、毎年<b>11月11日に中国で行われている独身の日を祝うイベント</b>です。2022年のダブルイレブンでは、ECプラットフォームや店舗などの関係者が売上高を伸ばすことに力を入れていました。その中で加盟店が示す戦況報告からは、中国のマーケットで、新しい産業やブランドが急成長しているのを垣間見ることができます。 本記事では、2022年ダブルイレブンのトレンドとなった業界を中心にご紹介します。


Popular AI Image Generators, “Midjourney” and “Stable Diffusion.” Who are giving attention?

Popular AI Image Generators, “Midjourney” and “Stable Diffusion.” Who are giving attention?

We will investigate "Midjourney" and "Stable Diffusion" AI Image Generators, which allow anyone to generate images from keywords. Let’s look into it users, its purpose, the reason for its popularity, and its strengths. We will analyze the data of the interest group and analyze our user experience.


お菓子業界5社をマーケティング視点で企業研究! 大学生のデータドリブン就活|2022年最新版

お菓子業界5社をマーケティング視点で企業研究! 大学生のデータドリブン就活|2022年最新版

お菓子業界大手の「森永製菓」「江崎グリコ」「カルビー」「ブルボン」「不二家」。各公式サイトの集客状況に注目し、強みや施策の違いを調査します。2年半前に公開した同記事の最新版として、新たな発見をお届けします。


行動経済学の入門書籍20選!教科書や今人気のベストセラーも紹介

行動経済学の入門書籍20選!教科書や今人気のベストセラーも紹介

経済学に心理学を組み合わせる「行動経済学」。マーケティングとの親和性の高さ、そしてマーケティング活動のためのヒントがあるとされており、さまざまな場面で活用が進んでいます。行動経済学をビジネスに活かすには、そのエッセンスがよくまとまった本・書籍で学ぶのが近道です。今回は、ベストセラー本から教科書的なものまで、行動経済学についてまんべんなく学べるよう、20冊のおすすめ本を紹介します。


競合も、業界も、トレンドもわかる、マーケターのためのリサーチエンジン Dockpit 無料登録はこちら