クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

企業がデータを活用するにあたっては、現場でデータ分析できる人材が増えることが重要です。分析したいときに他部署や外部に依頼せず、自分でデータ分析できれば、より素早く結果を得られます。また、外部に依頼した場合でも、分析に用いられている手法を理解し、分析の目的と合っているか判断する必要があります。そのためには「クロス集計」「ロジスティック回帰分析」「アソシエーション分析」「決定木分析」「クラスター分析」など、主要なデータ分析手法の基礎知識を身につけておきましょう。


データ分析の目的を明確にして適切な手法を用いるには

業務のスピードアップ、効率化を目指すには、担当者レベルでデータ分析を行えるのが理想的です。そのためには、先に挙げた分析方法それぞれの特徴を把握し、適切な場面で用いなければなりません。以下、それぞれのデータ分析手法について解説します。

マーケティングのデータ分析に使われる手法との基礎固めにおすすめの本9冊

https://manamina.valuesccg.com/articles/1013

膨大なデジタルデータが集まる現代では、経営やマーケティング施策の意思決定に「データ分析」を活用する企業が増えています。企業あるいは現場でデータを収集・分析・活用するために参考となる本をご紹介します。また、データ分析に使われる代表的な手法についてもまとめました。

アンケート分析の基本「クロス集計」

クロス集計は、アンケートの設問に対し、回答者の属性をかけ合わせて集計するデータ分析手法です。

例えば、「サービスの満足度は?」というアンケートを実施(回答者は男女それぞれ200名で合計400名)したとします。

サービスの満足度に性別というユーザーの属性をかけ合わせると、属性ごとの平均値を算出できます。

満足している どちらとも言えない 不満
男性 100名(50.0%) 60名(30.0%) 40名(20.0%)
女性 80名(40.0%) 50名(25.0%) 70名(35.0%)
全体 180名(45.0%) 110名(27.5%) 110名(27.5%)

分析結果が視覚的にわかりやすい、エクセルなどの表計算ソフトで手軽に集計結果を得られるメリットがある一方、1つのカテゴリーのサンプル数(n)は、最低でも30件は必要とされているので、注意が必要です。

事象の発生確率を測る「ロジスティック回帰分析」

ロジスティック回帰分析とは、ある事象の発生確率を複数の要因と組み合わせて分析する多変量解析の一種で、ある事象の発生率を算出する方法です。

よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。

それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。

このような分析以外にも、ロジスティック回帰分析は、災害の発生、顧客がDMに反応するか否かなど、幅広い分野で活用できるデータ分析手法とされています。

ロジスティック回帰分析の計算はエクセルのほか、統計解析フリーソフト「R」でも行えます。

関連性の発見に役立つ「アソシエーション分析」

「Aという商品を購入する人の○割が、Bという商品を購入する」という関連を分析する手法が、アソシエーション分析です。

もともとは店舗で使われている「POS(point of sales)データ」を分析するために開発されたデータ分析手法で、膨大なデータの中から関連性のあるものを抽出します。

抽出したルールには3つの指標があります。

支持度(support)
「商品Aを買う人が商品Bも買う」というルールが出現する割合

信頼度(confidence)
商品Aと商品Bの関連の強さ

リフト値(lift)
全体において、商品Aと商品Bを購入した人の割合

アソシエーション分析の有名な事例として、スーパーにおむつ(商品A)を買いにきた男性の多くが一緒にビール(商品B)も買う、というものがあります。買い物データの中からおむつを購入した人とビールを購入した人のデータをがあるとします。

全体的な数値として、おむつとビールを同時に購入する割合(リフト値)が低くても、おむつを購入した人がビールも購入した割合(支持度)が高ければ、おむつとビールの購入率には強い関連性(信頼度)がある、となります。

支持度、信頼度、リフト値はいずれもエクセルで算出可能です。

リスクマネジメントにも活用できる「決定木分析」

アンケート結果をもとに、「もし〜だったらどうなるか?」という仮定を何度も繰り返し、ツリー構造(樹形図)にして結果を複数パターン予測するのが、決定木分析です。

分岐点で複雑かつ多様な要因を整理・分析できるほか、分岐での確率も算出できるのが特徴です。

そのため、自社製品やサービス購入見込みが最も高い人物を探るなどの目的で使われるほか、金融機関においては顧客属性別の貸し倒れリスクの算出、工場での生産管理システムでの不良品発生率の予測といった、リスクマネジメントのためにも利用されています。

決定木作成にあたっては、エクセルのほか「edraw」といったツールも利用できます。

ユーザーのセグメンテーションなどに利用する「クラスター分析」

クラスター分析とは、異なるデータの集合体から類似するデータを集めてグルーピング(クラスター作成)し、その属性や特徴を分析する手法です。

分類の形式として、以下の2つの分析方法が用いられます。

階層的クラスター分析
類似するデータをクラスター化する手法で、過程が階層のようになり、最後は樹形図が完成します。類似性の近いものからクラスターを作成すればよいので、初めにクラスターの数を決める必要はありません。

非階層的クラスター分析
あらかじめクラスター化する数を決め、その中にサンプルを分けていく手法です。サンプル数が多い場合に適しています。

こうした分析から、セグメンテーションされたユーザーに対しての効果的なアプローチ方法の模索を行います。

なお、クラスター分析の事例は以下のリンクで紹介しているので、ぜひご参考ください。

Web行動ログデータを用いたクラスタリングとは?分析手法と事例を公開!

https://manamina.valuesccg.com/articles/639

マーケティングの分析で時々出てくる「クラスタ」や「クラスタリング」。聞いたことはあるけれど、何がわかるの?メリットやデメリットは?…など、疑問も多いのではないでしょうか。本資料では、アンケートを用いた従来のクラスタリングのメリット・デメリットをまずおさえ、新しい手法として注目を集めているWeb行動ログデータを使ったクラスタリングについて、アウトプットや活用事例を解説します。

まとめ

収集したデータは、分析して初めてその効果を発揮します。とはいえ、分析しただけでは無意味です。データ分析から意思決定の判断材料を掘り起こさなければなりません。よって、データ分析は、その結果をビジネス戦略を浮き彫りにするためのツールである、と認識しておく必要があります。

​​

メールマガジン登録

最新調査やマーケティングに役立つ
トレンド情報をお届けします

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


データ分析

関連する投稿


非財務の企業価値影響を測る「非財務価値サーベイ」と、サステナビリティ経営視点でのDockpit活用法|「VALUES Marketing Dive」レポート

非財務の企業価値影響を測る「非財務価値サーベイ」と、サステナビリティ経営視点でのDockpit活用法|「VALUES Marketing Dive」レポート

“データを通じて顧客を深く考える”“マーケティングの面白さに熱中する”という意味を込めたヴァリューズによるマーケティングイベント「VALUES Marketing Dive」。10/25に開催された今回の全体テーマは『未来を創り出す顧客理解の力』。顧客理解の追求は、マーケティング活動だけではなく、人材成長・組織活性化にも繋がると考えます。本セッションでは「サステナビリティ経営においてDockpitをどのように活用できるのか」というテーマのもと、具体的な分析結果を交え、電通・GLIN Impact Capital・ヴァリューズの3社で議論。また国内電通グループのオリジナルソリューション「非財務価値サーベイ」も紹介されました。


1年目データアナリストに読んでほしい本 ~ データ分析者の考え方・心構え編

1年目データアナリストに読んでほしい本 ~ データ分析者の考え方・心構え編

ヴァリューズの在籍2年目以上のデータアナリスト達に、1年目の自分に向けておすすめするとしたら、「これだけは読んでおいてほしい!」と思う本を紹介してもらいました。テーマは「技術以外の面で、データアナリストとしての自分の礎になっていると感じる本」です。技術が求められる職種でありながら、技術面以外にも分析者として読むことで視野が広がる本は沢山あるようです。記事内で紹介される本をめくってみると、データアナリスト達の脳内が覗き見できるかもしれません。


Tableauで正規表現を使って簡単にデータを変換してみよう【第2回】

Tableauで正規表現を使って簡単にデータを変換してみよう【第2回】

正規表現を使う事でTableau上で複雑なデータ処理を簡単に行う事が可能となり、Tableauでできることが飛躍的に広がります。


個人申込は5月22日(月)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2023年度夏

個人申込は5月22日(月)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2023年度夏

企業におけるデータ活用やDX推進の人材ニーズが高まる中で、今後非常に伸びていく資格試験として注目を集めているのが、一般社団法人 データサイエンティスト協会が主催する「データサイエンティスト検定™(DS検定★)」です。全国各地の試験会場で受験でき、2023年度夏の試験実施期間は2023年6月3日(土)~6月25日(日)を予定しています。個人申込みは2023年5月22日(月)まで。データサイエンティストを目指す方やデータ人材としてキャリアアップしたい方にとって重要なDS検定、ぜひこの機会にチャレンジしてみてはいかがでしょうか。


有料オンラインライブのニーズはコロナ収束後も続く? お笑いライブを題材に検証してみた

有料オンラインライブのニーズはコロナ収束後も続く? お笑いライブを題材に検証してみた

コロナ禍でリアルライブ開催に制限がかかる中、急成長を遂げた有料オンラインライブ。様々なジャンルで広く普及していますが、その一つにお笑いライブも含まれます。 2020年M-1グランプリのマヂカルラブリー優勝以降、「地下芸人」と呼ばれる地上波ではないライブの舞台で活躍する芸人への注目度が一層高まりつつある昨今。 お笑いライブシーンを題材に、リアルライブ再開後も一形態として定着しつつある有料オンラインライブの可能性を推察します。


最新の投稿


配膳ロボットの認知率は約9割、現在利用率は6割 1年後には利用率1.4倍伸びる!?【LINEリサーチ調査】

配膳ロボットの認知率は約9割、現在利用率は6割 1年後には利用率1.4倍伸びる!?【LINEリサーチ調査】

LINEリサーチは、今と近未来の流行予想を目的として「配膳ロボット」にかんする流行予想調査を実施し、その結果を公開しました。


約4割がメルマガきっかけでの商品購入経験あり/もっとも読まれやすいのは「19~20時台」【ラクス調査】

約4割がメルマガきっかけでの商品購入経験あり/もっとも読まれやすいのは「19~20時台」【ラクス調査】

株式会社ラクスは、「メルマガを読む時間帯」や「読みたいと思うメルマガの内容」など、一般のメール受信者を対象としてメールマガジンに関する調査を実施し、結果を公開しました。


BitStar、2024年1-3月「インフルエンサーパワーランキング」を発表!アニメとコラボレーションした楽曲が高視聴数を記録

BitStar、2024年1-3月「インフルエンサーパワーランキング」を発表!アニメとコラボレーションした楽曲が高視聴数を記録

株式会社BitStarは、インフルエンサーマーケティングプラットフォーム「BitStar Match」のデータに基づき、2024年1月~3月に活躍した動画クリエイターや動画チャンネルのランキングを発表しました。


現役Z世代が検索ワードからトレンドを考察!「イマーシブ・フォート東京」「変な家」のプロモーションを考察(2024年3月)【現役Z世代が読み解くZ世代の行動データ】

現役Z世代が検索ワードからトレンドを考察!「イマーシブ・フォート東京」「変な家」のプロモーションを考察(2024年3月)【現役Z世代が読み解くZ世代の行動データ】

Z世代のデータアナリストが、自らZ世代の行動データを分析する本連載。第17弾となる今回は、Z世代とミレニアル世代の検索キーワードランキングから、「イマーシブ・フォート東京」「変な家」「新生活」の3テーマを取り上げてZ世代のトレンドをお送りします。イマーシブ・フォート東京が刺さるのはどんな人?映画化で話題の「変な家」と、マンガ広告が生み出す購買活動とは?、Z世代のニーズに刺さる家電のサブスクリプションとは?など、データとリアルな声を掛け合わせ、Z世代のニーズを読み解きます。


いま「note」がアツい!人気の秘訣はSEO?noteの集客動向を調査<後編>

いま「note」がアツい!人気の秘訣はSEO?noteの集客動向を調査<後編>

2023年夏頃から集客数を急激に伸ばしているメディアプラットフォーム「note」。人気を後押ししているのはどのような人々なのでしょうか?前編では、noteが集客しているユーザーの特徴を深掘り調査し、後編では、noteが規模を拡大している要因を探っていきます。


競合も、業界も、トレンドもわかる、マーケターのためのリサーチエンジン Dockpit 無料登録はこちら

ページトップへ