【番外編】今年もやります!夏休みの自由研究サポート!!「お買い物データ」と「お天気データ」の関係を分析し、売れる数の予測を行ってみよう!

こんにちは。流通気象コンサルタント・気象予報士の常盤勝美です。いつも、気象条件と物の売れ行きの関係を、実際の購買データを用いて分析し解説していますが、夏休み時期ということで、今回は自由研究のテーマに悩む皆さんに向けた番外編です。夏休みの課題として、「購買データ(お店で買われたもののデータ)と気温の関係から、お店で売れる数を予測する!」自由研究をやってみませんか。中学校の数学で習う関数を利用しますので、中学生以上の方におすすめです。ぜひチャレンジしてみてください。

ステップ1 売れる数を予測する基本的な考え方を理解しよう!

お店で売られている数々の商品がその日どれだけ売れるか、売上の上下に影響する要因には何があるかを考えます。

これら多くの要因が及ぼす影響を考えた上で、日々お店の方たちは商品の売れる数を予測して、その予測に基づいて商品を仕入れています。皆さんの研究では、例えばお店の方にインタビューする、自分なりに影響がありそうな要因を考えるなど、してみてくださいね。今回は、数ある売上変動要因の中で気温に着目します。気温は、商品の売れる数に影響を与える多くの要因の中でも非常に重要な要因の一つだからです。気温と売上の関係性を分析し、その結果から売れる数を予測する計算式を組み立て、実際のデータを用いて売れる数の予測を立ててみます。

ステップ2 データを集めよう!

①購買データ

今回は、気温との関係性が明確で、売れる数の予測を立てやすい商品の購買データを用意しました。下にそれぞれの商品の売上グラフを示します。グラフの下のカテゴリ名をクリックするとデータがダウンロードできます。

<データダウンロードにあたってのお願い>(必ずお読みください)                      データダウンロードにあたっては、改めて本サイトのサイトポリシーをご覧ください。データをダウンロードされた場合、サイトポリシーに同意したと見なします。なお、本ブログにてダウンロード可能なデータについて弊社は、その正確性、安全性に関して万全を期しておりますが、いかなる保証もするものではありません。データダウンロードによって生じるいかなる不具合、損害についても、一切責任を負いません。

データ出典:True Data「ドルフィンアイ

②お天気データ

続いて、購買データとの関係を調べる”お天気データ”を取得します。気象庁のページからデータを取得する方法は、昨年8月に掲載したブログ「【番外編】夏休みの自由研究に悩む小中学生(と保護者の皆さん)必見!「お買い物データ」と「お天気データ」の関係をしらべてみよう!」を改めてご確認ください。 今回用意したデータ期間と同じ期間の東京の「お天気データ」を、こちらに用意しましたので、ここからダウンロードしていただいてもOKです。

ステップ3 お天気と売上の関係性を分析してみよう!

一般的な方法として、パソコンのExcel(エクセル)のソフトを使って関係性を分析します。詳しい分析の方法は、昨年8月のブログを改めて参考にしてみてください。散布図は、縦軸を購買データ、横軸を気温データとして作ります。この図を見れば両者の関係性がより分かりやすくなります。散布図がうまく作れない場合は、散布図を作りやすくするために売上のデータと気温のデータを並べたデータセットを用意しましたので、こちらを改めてダウンロードしてみてください。

プロットが右肩上がりの分布になっているのであれば、気温が高いときほど売れる数が多くなる商品、右肩下がりの分布になっているのであれば、気分が低いときほど売れる数が多くなる商品とみることができます。

解説:「コーヒードリンク」では、プロットがグラフの右側に行けば行くほど(つまり気温が高くなればなるほど)上の方に行っている(つまり買物指数が高くなっている)ことが分かります。それに対して「入浴剤」では、グラフの左側に行けば行くほど、上の方に行っている(つまり買物指数が高くなっている)ことが分かります。

ステップ4 売れる数を求める関数を作ろう!

今回は、気温(xとします)から売れる数(yとします)を求めるための計算式(関数式)を作ります。そのとき、Excelソフトにも搭載されている”近似曲線”の機能を使います。 近似曲線とは、散布図中の2組のデータの関係性を、線によって最も実際に近い形で表現するものです。今回は複雑な曲線ではなく、シンプルにy=ax+bの形で示される直線で関数式を立てます。つまり、分析によって求めるのは、その関数の係数(a:傾き、b:切片)です。手順は以下のとおりです。

①Excelの機能を使って、この分布の近似曲線を図の中に引きます。

②図中のプロットどれか一つを選択してマウスを右クリックします。

③表示されたウィンドウの、選択肢の下の方にある「近似曲線の追加」を選択します。

④次に、近似する線の種類の選択肢が表示されます。

※ここでは線形近似(最もシンプルな一次関数)を選択します。

⑤「近似曲線の書式設定」の中から、「グラフに数式を表示する」をチェック(✓)します。

⑥関数y=ax+bの形で数式が表示されます。aが傾き、bが切片です。

この手順にしたがい、様々な商品において係数a、bを求めます。

※よりレベルの高い予測方法を目指すテクニック(難しいと感じたら読み飛ばしてください)

今回は気温と売れる数の関係性がシンプル(直線状)なデータを用意しました。ですが実際にデータを分析すると、散布図中のプロットのぱらつきは、きれいな直線状になっていないものがほとんどです。

その場合に使える少し上級なテクニックの一つが、温度帯で分けて近似曲線を複数作るというものです。プロットを見ると、ある温度を境にその高温側と低温側でプロットの傾きが違うことがあります。厳密な分析を行う場合は何℃を境目とするか判断するためのより深い分析が必要ですが、目で見ておおむね○℃と設定しても、単純に1本の近似直線とした場合より精度の高い予測式となることでしょう。

ただし散布図を作る時、指定の温度以上と以下とでデータを分けてプロットを描く必要があります。

スポーツドリンクの例を紹介します。図 (a)はスポーツドリンクの散布図です。ここに近似直線を引くと図 (b)のようになります。プロットの分布と近似直線が、特に温度の高い領域で大きくズレてしまっています。これでは予測を行っても誤差の大きいものになってしまいます。そこで仮にデータを25℃以下のときと25℃以上のときで2つに分け、それぞれ近似直線を描くと図 (c)のようになります。実際予測を行う際、予想される温度によって当てはめる関数の式が変わりますが、こちらの方が、プロットの分布に近い直線になり、予測精度が高くなるはずです。

図(a)
図(b)
図(c)

ステップ5 実際に売れる数を予測しよう!

売れる数の関数を作ったら、気温のデータをxに代入し、売れる数(y)を計算します。例えばこの関数を使って実際に毎日、自分の地域の天気予報で予想最高気温を見ながらxに代入してみましょう。その地域におけるその商品の毎日の売れる数を予測することができます。前日に比べて気温が大きく上下した時など、売れる数の予測がどのように変化したかを調べ、その感想を考察にまとめてみましょう。

なおレポートにまとめる際はデータの出典を記載しましょう。もし、このブログからダウンロードした購買データを使う場合には、「データ出典:True Data」、「データ出典:気象庁」とレポートの最後の方に書いておいてくださいね。

まとめ(保護者の皆さまへ)

実際にお店で売れる数を予測する場合は一般に、週単位ではなく日単位で行います。今回の分析では考慮しませんでしたが、曜日による変動も当然あります。また、気温だけでなく、価格や広告チラシなど、ステップ1で示した様々な要因を考慮した複雑な計算や推察のもと、数百~数万規模での膨大な商品数の売れる数を日々予測し、発注仕入れを行っています。

さらに、当日お店の売場にどれだけの商品が置かれているか、お店の裏側の倉庫(バックヤード)にどれだけの在庫があるかによっても、売れる数は違ってきます(売れる条件が整っていても、お店の売場や倉庫にその商品がなければ売れない)。

このプロセスも含め、お店ではなるべくロスを出さないような取組みを行っています。その際、過去の購買実績データは非常に参考になります。

付録 True Data(トゥルーデータ)ってどんな会社?

『True Data』は日本語に訳すと“真実のデータ”。全国のスーパーマーケットやドラッグストアで商品が購入されたデータ「消費者購買データ」をあつかう会社です。その規模は約6000万人にもおよびます。このとても大きなデータを、スーパーマーケット、ドラッグストアで働く人や商品を作る会社(メーカー)の人が分析できるような仕組みを作り、実際にそれらのお客様に使ってもらっています。

本ブログに対するご意見、ご感想、気象と消費データに関するお問い合わせ等は、お気軽にこちら(https://www.truedata.co.jp/contact)までお寄せください。

株式会社True Data 流通気象コンサルタント 常盤 勝美
〈プロフィール〉
大学で地球科学を学び、民間の気象会社で約20年にわたりウェザーマーチャンダイジング関連サービスに従事。2018年6月、True Dataへ入社し、気象データマーケティングを推進。著書に『だからアイスは25℃を超えるとよく売れる』(商業界)など。気象予報士、健康気象アドバイザー、地球温暖化防止コミュニケーター。