Rを勉強していきます
はじめまして、小幡のぞみ(おばた・のぞみ)です。私は大学でマーケティングを勉強しながら、ヴァリューズでインターンとして働いていました。そして今年の4月、新卒としてヴァリューズに入社しました!
ヴァリューズの1年目・小幡さん
ヴァリューズはデータ分析をもとに企業のマーケティングを支援する会社。いまや「データマーケティング」という言葉もあるくらい、データ分析とマーケティングは切っても切れない関係になっています。デジタルを通じて大量に集まってくるデータを、どう活用すれば事業の成長につなげられるのか。データ分析はこれからもマーケティングのより重要な課題となるはずです。
一方私はと言えば、大学ではマーケティングをずっと勉強してきましたが、データ分析は全くで…。しかし、自分でデータ分析ができるようになれば、今後マーケティングの仕事をする上で必ず役に立つはず。いやむしろ、絶対にこれから必要なスキルになるのではないでしょうか。
そんなことを考えていたら、マナミナの企画として統計解析のプログラミング言語「R」を1から教えていただけることになりました! 講師はヴァリューズでデータアナリストをされている輿石さん。Rを使ったデータ分析業務に普段から携わっており、プログラミング初心者の勉強会で講師もされている方なんです。
そして、その模様を全部で7回に分けて、Rの導入から自由にデータを加工・分析するところまで、マナミナでお伝えしていきます。自らの手でデータ分析ができるようになりたいと考えるマーケターの方の参考になればと思います。
では、Rを使ったデータ分析をマスターできるよう、頑張ります!
Rとは、データ分析とは何か
輿石さん:これからよろしくお願いします!
株式会社ヴァリューズ ソリューション局 マネジャー
輿石拓真(こしいし・たくま)さん
早稲田大学政治経済学部卒業。データアナリストとして大手食品メーカー、大手証券会社など、多様な業界のデータ分析を実施。ヴァリューズ入社時から統計解析言語Rを軸としたデータ分析組織作りをおこなった経験をもとに、Tokyo.Rでの発表や業界大手企業などへのR勉強会も開催。
輿石さん:まずはじめに、Rを学ぶ過程の全体像を示しておきますね。これから全8回に分けて、1からRを学べるように分かりやすく説明していこうと思います。売上データやアクセス解析データなどのデータを、自由に加工・集計できるようになることを目標に置いています。
※編集部注:初出時、本連載は全7回の予定でしたが、編集の都合上、全8回に変更しました。その分内容も詳しくなりましたのでなにとぞ…!(2020.8.12追記)
輿石さん:初回は、データ分析とはそもそもどういったものなのか、またデータ分析にRを使う理由から説明していきます。
小幡:はい!よろしくお願いします。
輿石さん:まず「データ分析」ってどんなイメージがありますか?
小幡:えっと、Webの閲覧履歴やスーパーの販売履歴など蓄積しているデータを読み取り、どんな傾向があるのかを探りに行く、そして要因を分解する、みたいなイメージですね…!
輿石さん:そうですね。例えば棒グラフを作って、AとBを比較して「Aの方が多い」ということを言ったり、回帰分析や機械学習を使って予測してみる、といったものが頭に浮かぶと思います。ただ、実はここまでの道のりが結構大変で、ハードルがあるんです。この道のりをまとめたのが、次の図の「Import」「Tidy」「Transform」というものです。
輿石さん:データ分析がどんな流れで行われるのかを表したのがこの図です。まず、会社によっていろんなデータが溜まっています。例えばWeb系の会社であれば、自社サイトへのアクセス履歴が溜まっていたりとか。このデータというのは、生の状態で何万行と格納されていて、分析に適した形ではないことが多いです。それをRなどのソフトに読み込んで(=Import)、Rで扱いやすい状態に整形(=Tidy(タイディー))し、加工や集計(=transform)を行うといった作業が必要になります。
小幡:「Tidy」とは、具体的にどんなことをするんですか?
輿石さん:人間が見やすいデータと機械が見やすいデータというのは結構違うんですよ。例えば、サイトの月別のユーザー数推移が見たいとします。Excelで表現するとしたら、たぶん次の図のように、横に月名、縦にサイト名があって、それぞれに数字が入っている形を想像しますよね。
輿石さん:でもそれは、実は機械にとっては扱いにくいデータ形式なんです。機械が分かりやすいのは、1列1列にサイト名、月名、UU数とそれぞれ同じものが入っている形。そういった『データを機械が認識しやすい形にする』というのがTidyというセクションです。第3回でもう少し詳しく説明しますね。一度読みやすい形にしてしまえば、月別だったものを四半期ごとに集計し直す、ページビュー数など新しい情報を付与するといったこともできるようになります。この部分がTransformのセクションですね。
輿石さん:ちなみに、グラフを作るVisualiseや機械学習や統計的な分析を行なうModelの部分では、自動化ツールやプログラミングなしで使えるサービスも出てきています。難しく捉えられがちな後半セクションの敷居が下がりつつありますが、読み込み・加工といった初期段階の部分はハードルが残っています。逆に言えば、初期段階をマスター出来れば、その先もツールの導入次第でできるようになるかもしれません。そう思ってここを頑張ってください。
小幡:分かりました、頑張ります…! でも、データ分析の言語としてはRが一番良いのでしょうか? 他に簡単なのもあるのかなとつい思ってしまって……。
輿石さん:そうですね。データ分析では「R」か「Python」かで多くの人が悩むと思いますが、プログラム未経験でマーケター志向の方にはRをおススメします。僕自身も学生時代はプログラミング未経験でしたが、Rは初心者にも優しく作られていて、するすると頭に入ってきました。プログラミングは挫折しやすいと言われているので、初心者に優しいという観点が大事だと思います。
輿石さん:なぜRがプログラミング未経験者に優しいのかと言うと、もともとのRをより使いやすくしたパッケージ群「tidyverse(タイディバース)」のおかげなんです。tidyverseは使う人が理解しやすいことをとても重視して作られているんです。tidyverseを使うと、文章を書くようにやりたいことを順番に書いてデータを加工していくことで、自分の欲しい情報を手に入れることができる、と僕は捉えています。初心者にも優しい言語だと思うので、気負いせずに頑張っていきましょうね。システムを作りたい、機械学習をとことんやりたい、という方にはPythonの方が向いているかもしれませんが、Rもやっておいて損はないですよ(笑)。
小幡:そうなんですね。何だか少し安心してきました(笑)。
Rをインストールします
輿石さん:ではここから、Rのインストールの説明に移ります。小幡さんはWindowsPCなので、ここでは「R for windows」のインストール法を説明していきますね。以下のような手順で進みましょう。
1.「R for windows」のインストール
2.「RStudio」のインストール
ではまず、「R for windows」のインストールから始めましょう。次のURLをブラウザで開き、続く画像の通りにクリックしていきます。
小幡:ダウンロードしました!
輿石さん:「R-3.6.3-win.exe」というファイルがダウンロードされたと思います。3.6.3の部分はバージョン番号なので、3.6.4や3.7.0など変わっているかもしれませんが、気にせず進めてください。ダブルクリックしてインストーラーを起動しましょう。
輿石さん:基本的には「次へ」でOKです。ひとつ注意点があって、「インストール先の指定」を聞かれると思います。ここは変更しないようにしてください。また、「コンポーネントの選択」画面では、自分のPCが32-bitか64-bitかに合わせて「64-bit利用者向けインストール」か「32-bit利用者向けインストール」どちらかを選択してください。
輿石さん:輿石さん:後は何も気にせず「次へ」でOKです。これで、「R for windows」はインストールできたと思います。
小幡:できました!
輿石さん:順調です。次のステップ「RStudioのインストール」は簡単です。このRStudioはRを使いやすくするための便利ツールだと思ってください。「Rを使いたい」となったら、先ほどインストールした「R」ではなく、この「RStudio」を起動します。
輿石さん:まず今までと同じように、RStudioのインストーラをダウンロードしましょう。下記のURLにアクセスして、「DOWNLOAD RSTUDIO FOR WINDOWS」というボタンからインストーラをダウンロードします。現時点では「RStudio-1.2.5033.exe」というファイルがダウンロードされると思います。(1.2.5033という数字の部分はバージョン番号なので、ここが少し違っても問題ないので進めてください。)
RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, and a variety of robust tools for plotting, viewing history, debugging and managing your workspace.
輿石さん:.exeファイルをダブルクリックしてインストールを開始します。ここでは、特別な変更は何もせずに「次へ」と「インストール」でインストールが完了します。
小幡:簡単ですね。できました!
輿石さん:ここまででインストールは完了です!最後にRStudioを起動できるか確認して見ましょう。「R」ではなく「RStudio」を起動してくださいね。このアイコンです。
小幡:はい、RStudioが立ち上がりました!
輿石さん:よくできましたね。これでRを使う準備が完了しましたよ。
今日のまとめと感想
さて、今回はここまでです! データ分析とはどういったものか、Rを使う意義とは何かを学び、実際にRを使う準備までが今回で完了しました。まだ導入部分だと言うのに、大きな一歩を踏み出したような気持ちです…!
さて次回はいよいよ実際にRを触り、基礎を学んでいきます。できるようになるか不安もありますが、とても楽しみです。では、次回をお楽しみに!
Rの基礎知識「関数」「パッケージ」「データフレーム」とは。マーケターが1からRを勉強します【第2回】
https://manamina.valuesccg.com/articles/756マーケター1年目の小幡さんがRを学んでいきます。講師は株式会社ヴァリューズのデータアナリスト、輿石さん。第2回はRを使う上でおさえておきたい事前知識をつけていきます。Rでデータを扱えるようになりたいと考えている方、ぜひ小幡さんと一緒に勉強していきましょう。
メールマガジン登録
最新調査やマーケティングに役立つ
トレンド情報をお届けします
大学でマーケティングを勉強しながら、ヴァリューズでインターンとして働いていました。2020年の春からは新卒としてヴァリューズに入社しました。