クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

クロス集計や回帰分析など、データ分析でよく使われる手法の基礎知識

企業がデータを活用するにあたっては、現場でデータ分析できる人材が増えることが重要です。分析したいときに他部署や外部に依頼せず、自分でデータ分析できれば、より素早く結果を得られます。また、外部に依頼した場合でも、分析に用いられている手法を理解し、分析の目的と合っているか判断する必要があります。そのためには「クロス集計」「ロジスティック回帰分析」「アソシエーション分析」「決定木分析」「クラスター分析」など、主要なデータ分析手法の基礎知識を身につけておきましょう。


データ分析の目的を明確にして適切な手法を用いるには

業務のスピードアップ、効率化を目指すには、担当者レベルでデータ分析を行えるのが理想的です。そのためには、先に挙げた分析方法それぞれの特徴を把握し、適切な場面で用いなければなりません。以下、それぞれのデータ分析手法について解説します。

マーケティングのデータ分析に使われる手法との基礎固めにおすすめの本9冊

https://manamina.valuesccg.com/articles/1013

膨大なデジタルデータが集まる現代では、経営やマーケティング施策の意思決定に「データ分析」を活用する企業が増えています。企業あるいは現場でデータを収集・分析・活用するために参考となる本をご紹介します。また、データ分析に使われる代表的な手法についてもまとめました。

アンケート分析の基本「クロス集計」

クロス集計は、アンケートの設問に対し、回答者の属性をかけ合わせて集計するデータ分析手法です。

例えば、「サービスの満足度は?」というアンケートを実施(回答者は男女それぞれ200名で合計400名)したとします。

サービスの満足度に性別というユーザーの属性をかけ合わせると、属性ごとの平均値を算出できます。

満足している どちらとも言えない 不満
男性 100名(50.0%) 60名(30.0%) 40名(20.0%)
女性 80名(40.0%) 50名(25.0%) 70名(35.0%)
全体 180名(45.0%) 110名(27.5%) 110名(27.5%)

分析結果が視覚的にわかりやすい、エクセルなどの表計算ソフトで手軽に集計結果を得られるメリットがある一方、1つのカテゴリーのサンプル数(n)は、最低でも30件は必要とされているので、注意が必要です。

事象の発生確率を測る「ロジスティック回帰分析」

ロジスティック回帰分析とは、ある事象の発生確率を複数の要因と組み合わせて分析する多変量解析の一種で、ある事象の発生率を算出する方法です。

よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。

それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。

このような分析以外にも、ロジスティック回帰分析は、災害の発生、顧客がDMに反応するか否かなど、幅広い分野で活用できるデータ分析手法とされています。

ロジスティック回帰分析の計算はエクセルのほか、統計解析フリーソフト「R」でも行えます。

関連性の発見に役立つ「アソシエーション分析」

「Aという商品を購入する人の○割が、Bという商品を購入する」という関連を分析する手法が、アソシエーション分析です。

もともとは店舗で使われている「POS(point of sales)データ」を分析するために開発されたデータ分析手法で、膨大なデータの中から関連性のあるものを抽出します。

抽出したルールには3つの指標があります。

支持度(support)
「商品Aを買う人が商品Bも買う」というルールが出現する割合

信頼度(confidence)
商品Aと商品Bの関連の強さ

リフト値(lift)
全体において、商品Aと商品Bを購入した人の割合

アソシエーション分析の有名な事例として、スーパーにおむつ(商品A)を買いにきた男性の多くが一緒にビール(商品B)も買う、というものがあります。買い物データの中からおむつを購入した人とビールを購入した人のデータをがあるとします。

全体的な数値として、おむつとビールを同時に購入する割合(リフト値)が低くても、おむつを購入した人がビールも購入した割合(支持度)が高ければ、おむつとビールの購入率には強い関連性(信頼度)がある、となります。

支持度、信頼度、リフト値はいずれもエクセルで算出可能です。

リスクマネジメントにも活用できる「決定木分析」

アンケート結果をもとに、「もし〜だったらどうなるか?」という仮定を何度も繰り返し、ツリー構造(樹形図)にして結果を複数パターン予測するのが、決定木分析です。

分岐点で複雑かつ多様な要因を整理・分析できるほか、分岐での確率も算出できるのが特徴です。

そのため、自社製品やサービス購入見込みが最も高い人物を探るなどの目的で使われるほか、金融機関においては顧客属性別の貸し倒れリスクの算出、工場での生産管理システムでの不良品発生率の予測といった、リスクマネジメントのためにも利用されています。

決定木作成にあたっては、エクセルのほか「edraw」といったツールも利用できます。

ユーザーのセグメンテーションなどに利用する「クラスター分析」

クラスター分析とは、異なるデータの集合体から類似するデータを集めてグルーピング(クラスター作成)し、その属性や特徴を分析する手法です。

分類の形式として、以下の2つの分析方法が用いられます。

階層的クラスター分析
類似するデータをクラスター化する手法で、過程が階層のようになり、最後は樹形図が完成します。類似性の近いものからクラスターを作成すればよいので、初めにクラスターの数を決める必要はありません。

非階層的クラスター分析
あらかじめクラスター化する数を決め、その中にサンプルを分けていく手法です。サンプル数が多い場合に適しています。

こうした分析から、セグメンテーションされたユーザーに対しての効果的なアプローチ方法の模索を行います。

なお、クラスター分析の事例は以下のリンクで紹介しているので、ぜひご参考ください。

Web行動ログデータを用いたクラスタリングとは?分析手法と事例を公開!

https://manamina.valuesccg.com/articles/639

マーケティングの分析で時々出てくる「クラスタ」や「クラスタリング」。聞いたことはあるけれど、何がわかるの?メリットやデメリットは?…など、疑問も多いのではないでしょうか。本資料では、アンケートを用いた従来のクラスタリングのメリット・デメリットをまずおさえ、新しい手法として注目を集めているWeb行動ログデータを使ったクラスタリングについて、アウトプットや活用事例を解説します。

まとめ

収集したデータは、分析して初めてその効果を発揮します。とはいえ、分析しただけでは無意味です。データ分析から意思決定の判断材料を掘り起こさなければなりません。よって、データ分析は、その結果をビジネス戦略を浮き彫りにするためのツールである、と認識しておく必要があります。

​​

メールマガジン登録

最新調査やマーケティングに役立つ
トレンド情報をお届けします

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


データ分析

関連する投稿


データサイエンティスト協会「11thシンポジウム~データサイエンスの最前線~」11月11日(月)開催!

データサイエンティスト協会「11thシンポジウム~データサイエンスの最前線~」11月11日(月)開催!

データサイエンスの最新トレンドを発信する一般社団法人 データサイエンティスト協会主催のイベント「11thシンポジウム~データサイエンスの最前線~」が、2024年11月11日(月)に開催します。年間を通じて活動している「データサイエンティスト」の育成・啓発活動の実践的な知識や成果に加え、生成AIの今後の展望などデータサイエンスの最新情報を知ることができます。ぜひこの機会に参加してみてはいかがでしょうか。


非財務の企業価値影響を測る「非財務価値サーベイ」と、サステナビリティ経営視点でのDockpit活用法|「VALUES Marketing Dive」レポート

非財務の企業価値影響を測る「非財務価値サーベイ」と、サステナビリティ経営視点でのDockpit活用法|「VALUES Marketing Dive」レポート

“データを通じて顧客を深く考える”“マーケティングの面白さに熱中する”という意味を込めたヴァリューズによるマーケティングイベント「VALUES Marketing Dive」。10/25に開催された今回の全体テーマは『未来を創り出す顧客理解の力』。顧客理解の追求は、マーケティング活動だけではなく、人材成長・組織活性化にも繋がると考えます。本セッションでは「サステナビリティ経営においてDockpitをどのように活用できるのか」というテーマのもと、具体的な分析結果を交え、電通・GLIN Impact Capital・ヴァリューズの3社で議論。また国内電通グループのオリジナルソリューション「非財務価値サーベイ」も紹介されました。


1年目データアナリストに読んでほしい本 ~ データ分析者の考え方・心構え編

1年目データアナリストに読んでほしい本 ~ データ分析者の考え方・心構え編

ヴァリューズの在籍2年目以上のデータアナリスト達に、1年目の自分に向けておすすめするとしたら、「これだけは読んでおいてほしい!」と思う本を紹介してもらいました。テーマは「技術以外の面で、データアナリストとしての自分の礎になっていると感じる本」です。技術が求められる職種でありながら、技術面以外にも分析者として読むことで視野が広がる本は沢山あるようです。記事内で紹介される本をめくってみると、データアナリスト達の脳内が覗き見できるかもしれません。


Tableauで正規表現を使って簡単にデータを変換してみよう【第2回】

Tableauで正規表現を使って簡単にデータを変換してみよう【第2回】

正規表現を使う事でTableau上で複雑なデータ処理を簡単に行う事が可能となり、Tableauでできることが飛躍的に広がります。


個人申込は5月22日(月)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2023年度夏

個人申込は5月22日(月)まで!DS協会「データサイエンティスト検定™ リテラシーレベル」2023年度夏

企業におけるデータ活用やDX推進の人材ニーズが高まる中で、今後非常に伸びていく資格試験として注目を集めているのが、一般社団法人 データサイエンティスト協会が主催する「データサイエンティスト検定™(DS検定★)」です。全国各地の試験会場で受験でき、2023年度夏の試験実施期間は2023年6月3日(土)~6月25日(日)を予定しています。個人申込みは2023年5月22日(月)まで。データサイエンティストを目指す方やデータ人材としてキャリアアップしたい方にとって重要なDS検定、ぜひこの機会にチャレンジしてみてはいかがでしょうか。


最新の投稿


タイのコーヒーの特徴とは?タイのコーヒー市場の現状やショップを紹介

タイのコーヒーの特徴とは?タイのコーヒー市場の現状やショップを紹介

近年タイではコーヒーブームが起こっています。バンコクには次々と新しいカフェができており、SNS映えする店内だけではなくコーヒーの味にもこだわりを持つカフェが増えています。実際に、起業してカフェオーナー兼バリスタになるのはタイでは一つのトレンドです。 近年、タイのコーヒー市場は右肩上がりに伸びており、タイのコーヒー市場は日本円で1440億円を超えると言われています。 そこで本記事では、タイのコーヒー市場の現状を読み解くとともに、タイでなぜコーヒーの人気が高まっているのかを、タイのコーヒーブームの歴史と共に解説します。


2025年上半期Z世代トレンド予想!Trepo、「ファッション」「グルメ」「コト・モノ」の3部門のランキングを発表

2025年上半期Z世代トレンド予想!Trepo、「ファッション」「グルメ」「コト・モノ」の3部門のランキングを発表

株式会社Creative Groupは、同社が運営するメディア『トレンドメディアTrepo(トレポ)』にて、10代~20代の女性を対象に、2025年上半期のZ世代トレンド予想調査を実施し、結果を公開しました。


ADK MS、「ゲーム総合調査レポート2024」を発表!最新のゲーム市況の把握から、ゲームプレイヤーの行動・心理の分析まで網羅

ADK MS、「ゲーム総合調査レポート2024」を発表!最新のゲーム市況の把握から、ゲームプレイヤーの行動・心理の分析まで網羅

株式会社ADKマーケティング・ソリューションズは、ゲームプレイヤーの心理・行動を分析し、分かりやすく彼らの実態を可視化した「ゲーム総合調査レポート2024」を作成し、公開しました。


スリープテック ~ 睡眠の質とテクノロジー

スリープテック ~ 睡眠の質とテクノロジー

疲労回復、毎日のコンディション管理に必要不可欠な「睡眠」。その睡眠、あなたは足りていますか?最近ではニュースでも多く取り上げられた通り、日本は世界規模での「不眠大国」。実に日本人の平均睡眠時間は経済協力開発機構(OECD)の加盟国33ヵ国の中で最下位とも言われています。そして睡眠はただ眠るだけではなく、経済とも大いに関わりがあるのです。本稿では広告・マーケティング業界に40年近く従事し、現在は株式会社創造開発研究所所長、一般社団法人マーケティング共創協会理事・研究フェローを務めている渡部数俊氏が、良質な睡眠の鍵を解説します。


BtoBマーケティングの成功は"ファクトファインディング"が重要!本質的・潜在的な課題・ニーズを引き出すことが成功のカギ【PRIZMA調査】

BtoBマーケティングの成功は"ファクトファインディング"が重要!本質的・潜在的な課題・ニーズを引き出すことが成功のカギ【PRIZMA調査】

株式会社PRIZMAは、全国のマーケティングコンサルタントを対象に、「BtoBマーケターが始めた方が良いこと」に関する調査を実施し、結果を公開しました。


競合も、業界も、トレンドもわかる、マーケターのためのリサーチエンジン Dockpit 無料登録はこちら

アクセスランキング


>>総合人気ランキング

ページトップへ