マーケティングの基礎知識!データ分析の「回帰分析」とは?

マーケティングの基礎知識!データ分析の「回帰分析」とは?

商品の需要予測やプロモーションするとどのくらい来店者数が増えるかなど、ある結果に対する要因を推測するために数式化する「回帰分析」。IT技術の発展で集まった大量のデータは「回帰分析」などの統計手法でデータ分析され、マーケティングに活用されています。


ビッグデータから「相関関係」を見出すには?

POSデータや広告の効果測定など、大量かつ複雑なデータから意味や傾向を見出すには、「暑くなればビールが売れる」と言った原因と結果、またその時の傾きはどのくらいか、などの分析が必要です。売上を増やす要因がわかれば、暑い天気予報の日には広告予算を増やしたり、売上から逆算される予算規模はどのくらいかなどの予測に活用できます。

数学的には、Aが増えればBも増える関係を「正の相関関係」、Aが増えるとBが減る関係を「負の相関関係」と言います。

なお「相関関係」と「因果関係」は似ていますが、Aが変わるとBも変わる関係を相関関係、Bが変わる要因がAという関係が因果関係です。例えば、スターバックスが多いエリアは人口が多いという相関関係において、スタバを増やせば人口が増えるわけではなく、人口が増えるとスターバックスも増える、という因果関係が考えられます。

回帰分析とは?回帰分析の基本

ビジネスにおいて、販促すると売上が上がることがわかっていたとして、知りたいのはその傾きがどのくらいか、あるいは効果が最大になる予算はいくらかなどの予測でしょう。

ある結果を説明する際、関連する要因がどのくらい結果を左右するのかを関数で数式化し、その結果をもとに将来の予測を立てる統計手法が「回帰分析」です。回帰分析では「ある結果」を「目的変数」、「関連する要因」を「説明変数」と置き換えます。

回帰分析には大別して3つの分析方法があります。まずは説明変数が1つで、1つの要因から結果を予測する「単回帰分析」。2つ以上の要因から結果を予測する「重回帰分析」。そして正規分析を想定している単回帰分析や重回帰分析ではそれに当てはまらないケースもあり、こうした場合に用いる「ロジスティック回帰分析」があります。

以下、それぞれの詳細を解説します。

単回帰分析

説明変数が1つである単回帰分析の説明例として、広告配信からの売上数の予測を挙げます。広告配信の回数と売上数のデータを多く収集し、目的変数である売上数の予測を数式化しましょう。

単回帰分析は「Y=aX+b」という一次関数で表せます。Xが説明変数、Yは目的変数です。単回帰分析はエクセルを利用すると素早く算出できます。

広告配信と売上数の関係を例に見ていきましょう。

まず、広告の配信回数(1日、1週間など期間を決める)と売上数(広告の配信回数の基準期間と同じくする)のデータを収集します。

続いて、売上数をY軸、広告配信回数をX軸として散布図を作成します。散布図上の1点から「近似曲線の追加」を選択します。このときに「グラフに数式を表示する」と「グラフにR-2乗値を表示する」にチェックを入れます。これによりY=aX+bのaとbの部分に数値が入った数式が表示されます。

この結果から1回の広告配信でa個の売上数向上が見込めることがわかります。単純に向上する売上個数がわかるだけではなく、a個の売上利益と1回の広告配信の費用のバランスを見て、広告配信費用のほうが高い場合はこれ以上の広告配信は行わないという判断、そして、販売個数の目標を立てた場合、広告配信の回数をどれぐらい増やせば効果を得られるのかという予測もできます。

重回帰分析

単回帰分析では、広告配信回数と売上数の分析だけでしたが、売上数を左右する要素は広告配信回数だけではなく、ほかの要素も絡んできます。そうした要素、つまり2つ以上ある説明変数が売上数(=目的変数)に与える影響度を分析するのが「重回帰分析」です。

重回帰分析は「y=b1X1+b2X2+b3X3+……b0」という式で表せ、複数のX、つまり説明変数が使われています。今回は月ごとの売上数を広告配信回数、問い合わせ数、アクセス数から予測する式を求め、それぞれの説明変数が売上数にどれぐらいの影響を与えるのかを例として挙げます。

月ごとの売上数、広告配信回数、問い合わせ数、アクセス数(単位は1000回を1とします)のデータを並べてエクセルの分析ツールにある「回帰分析」を利用します。出力された結果の「分散分析表」の「係数」の部分が、売上数を予測する回帰式にあてはまるようになります。

たとえば、b1が10だった場合、広告配信回数を1回増やすと売上数が10個増える。b2が3だった場合、問い合わせが1件増えると売上数が3個増える。b3が12だった場合、アクセス数が1000回増えると12個増える、というようになります。

このように、各説明変数が説明変数にどれほどの影響を与えているのかを読み取れます。この例では、売上数にもっとも影響を及ぼすのはアクセス数であると判断できるので、売上数を伸ばすためにアクセス数を増やす方法を検討する、という流れになります。

このほかにも重回帰分析で求めらられた回帰式の各説明変数の部分(X1=広告配信回数、X2=問い合わせ数、X3=アクセス数)に具体的な数値を入れると、売上数のおおまかな予測を算出できます。

ロジスティック回帰分析

ロジスティック回帰分析とは、目的変数がAであるか or Bであるかという二者択一の場合、もしくは割合(率)の場合、かつ、説明変数が2つある場合に用いられるもので、多変量解析の一種です。

よく挙げられる例として、リスク因子による病気の発生確率の分析があります。例えば、1日あたりのアルコールの摂取量と喫煙本数のデータからがんの発生率を分析、というものがあります。

それぞれのデータをもとに、アルコールの摂取量や喫煙本数がこれぐらいであれば、がんに罹患する確率はこれほど、という予測を立てられます。

このような分析以外にも、DMを送付した顧客ひとあたりの購入率を算出し、購入率の高い顧客を中心にDMを送付するという施策を立てられたり、キャンペーン用のWebページを作成し、そこを閲覧後に購入したユーザーと閲覧せずに購入したユーザーの割合をチェックしてキャンペーン用Webページの効果を分析する、といったことも可能になります。

なお、ロジスティック回帰分析の計算はエクセルのほか、統計分析フリーソフト「R」でも行えます。

まとめ

売上向上のために必要な施策を検討する上で欠かせない回帰分析。

ある施策が売上増につながることがわかった場合、より効率的な施策の実行回数を割り出すほか、未知の売上であっても既存の説明変数を用いて重回帰分析を用いて売上全体、そしてどの説明変数が影響を及ぼすかを計れます。

単回帰・重回帰分析では目的変数は1つですが、ロジスティック回帰分析を用いれば2つの目的変数、もしくは割合求められます。

このように状況に応じた「回帰分析」によって、これから行うべき施策を明確にできることでしょう。

​​

メールマガジン登録

最新調査やマーケティングに役立つ
トレンド情報をお届けします

この記事のライター

マナミナは" まなべるみんなのデータマーケティング・マガジン "。
市場の動向や消費者の気持ちをデータを調査して伝えます。

編集部は、メディア出身者やデータ分析プロジェクト経験者、マーケティングコンサルタント、広告代理店出身者まで、様々なバックグラウンドのメンバーが集まりました。イメージは「仲の良いパートナー会社の人」。難しいことも簡単に、「みんながまなべる」メディアをめざして、日々情報を発信しています。

関連するキーワード


データ分析 マーケティング

関連する投稿


仮説のレベルを一段上げる。電通の分析ツール活用法 |「VALUES Marketing Dive」レポート

仮説のレベルを一段上げる。電通の分析ツール活用法 |「VALUES Marketing Dive」レポート

ヴァリューズは、“データを通じて顧客のことを深く考える”、“マーケティングの面白さに熱中する”という意味を込め、マーケティングイベント「VALUES Marketing Dive」を5/26に開催しました。本セミナーの全体テーマは「Update Your Marketing」。これからの時代、生活者には新たな価値観や購買行動が生まれ、マーケティング戦略や施策はさらなるアップデートが求められます。本講演では電通のプランナーをお迎えし、「仮説のレベルを一段上げる Dockpit活用法」と題して、リアルな声をふまえたツール活用法をご紹介いただきました。


DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは? | 「VALUES Marketing Dive」レポート

DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは? | 「VALUES Marketing Dive」レポート

ヴァリューズは、“データを通じて顧客のことを深く考える”“マーケティングの面白さに熱中する”という意味を込め、新しいマーケティングイベント「VALUES Marketing Dive」を5月26日に開催しました。本セミナー全体のテーマは「Update Your Marketing」。Withコロナ時代、生活者には新たな価値観や消費行動が生まれ、マーケティング戦略や施策においては、さらなるアップデートが求められています。本講演では、『DX推進に潜むギャップと落とし穴。高まる「Demand」の重要性とは』と題し、キーノートをお届けしました。


競合サイトのアクセス数を測るには?競合分析に欠かせない5つのポイントを解説

競合サイトのアクセス数を測るには?競合分析に欠かせない5つのポイントを解説

Googleの検索ロジックが複雑化していく中で、競合サイトの調査・分析は、自社サイトのSEO対策に役立ちます。検索上位のサイトには、Googleから評価される要素があるとみなし、自社サイトに足りない分を補いましょう。競合サイト分析に使えるツールも紹介します。


競合サイト分析に使えるWebツール9選

競合サイト分析に使えるWebツール9選

自社サイトのアクセス数増のために行うSEO対策や広告出稿。その手段はさまざまですが、競合するサイトをベンチマークとして、自社サイトよりも優れている点やその要因を分析することもひとつの方法です。特にSEO対策を目的とした競合分析にあたっての考え方、競合分析に使えるツールを紹介します。


データ人材としてのキャリアアップに!DS協会「データサイエンティスト検定™ リテラシーレベル」

データ人材としてのキャリアアップに!DS協会「データサイエンティスト検定™ リテラシーレベル」

企業におけるデータ活用やDX推進の人材ニーズが高まる中で、今後非常に伸びていく資格試験として注目を集めているのが、一般社団法人 データサイエンティスト協会が主催する「データサイエンティスト検定™(DS検定★)」です。全国各地の試験会場で受験でき、試験実施期間は2022年6月10日(金)〜6月30日(木)を予定しています。個人申込みは5月31日(火)まで。データサイエンティストを目指す方やデータ人材としてキャリアアップしたい方にとって重要なDS検定、ぜひこの機会にチャレンジしてみてはいかがでしょうか。※2022年6月試験のお申し込みは終了しました


最新の投稿


急上昇ワードに「東京アメッシュ」など...「週間」検索キーワードランキング(2022/9/18~2022/9/24)

急上昇ワードに「東京アメッシュ」など...「週間」検索キーワードランキング(2022/9/18~2022/9/24)

ネット行動ログをもとに週次の検索急上昇ワードランキングを作成し、トレンドになっているワードについて取り上げます。2022年9月18日~9月24日の検索急上昇ワードでは、降雨状況の変化を短い周期で追える「東京アメッシュ」といったサイトの他、台風関連のワードが多数ランクイン。劇場版最新作が公開中の「ガリレオ」シリーズに関する検索も複数見られました。


【2022年10月10日週】注目のマーケティングセミナー・勉強会・イベント情報まとめ

【2022年10月10日週】注目のマーケティングセミナー・勉強会・イベント情報まとめ

編集部がピックアップしたマーケティングセミナー・勉強会・イベントを一覧化してお届けします。


SNS × ユーザーリサーチ対談|マナミナ・トークLIVE

SNS × ユーザーリサーチ対談|マナミナ・トークLIVE

マナミナ・トークLIVEが10月14日(金) 17:00〜18:00で配信決定!「SNS×ユーザーリサーチ」をテーマに、企業のSNS運営支援実績を多数お持ちのマーケティングコンサルタント・吉田啓介さんと、SNSを使ったユーザーリサーチのnote記事が人気のリサーチャー・菅原大介さんによる対談をLIVE配信します。


コンテンツマーケティング最新動向レポート(2022年9月版)|ホワイトペーパー

コンテンツマーケティング最新動向レポート(2022年9月版)|ホワイトペーパー

国内外のSEO対策・SNSでの集客法など、コンテンツマーケティングに関する最新情報を毎月まとめてご紹介。インフルエンサーマーケティング3.0とは?バーチャルインフルエンサーの最新トレンドは?押さえておくべきSEO最新ニュースは?など、コンテンツマーケター必見のレポートを、今月もお届けします。(ページ数|53ページ)


【急上昇サイト】フィギュアイベントや楽天コミュニティアプリがサイト集客に成功した理由|2022年8月

【急上昇サイト】フィギュアイベントや楽天コミュニティアプリがサイト集客に成功した理由|2022年8月

2022年8月にユーザー数を伸ばしたWebサイトは? SaaS型のWeb行動ログ分析ツール「Dockpit(ドックピット)」を使うと、どんな人がどんなWebサイトを見ているのか、いろいろな切り口で簡単に調べることができます。訪問ユーザー数の前月比が急上昇したWebサイトを調査しました。


競合も、業界も、トレンドもわかる、マーケターのためのリサーチエンジン Dockpit 無料登録はこちら