こんにちは。流通気象コンサルタント・気象予報士の常盤勝美です。気象庁発表の季節予報によると、今年の夏は猛暑傾向となる可能性が高まっていますね。特に7月はここ最近2年連続で長梅雨による天候不順とやや低温傾向だったため、それとは大きく異なる7月になるのではないかと考えられます。暑い陽気になったら欲しくなるものの王道が氷ですね。今回はシンプルに、氷の購入金額と気温の関係を詳しく分析し、分析時のコツなど含めて解説いたします。
時系列で見る「氷」の売上と気温の関係
まずは氷の買物指数と、その時の最高気温のデータをそれぞれ時系列のグラフで示します(図1)。
このように、データを単純に時系列に並べて、どんなことが言えるか、どんな仮説が立てられるか、自分の目で見て確かめるのが重要なプロセスです。この場合、氷の買物指数(黒)は、多少形状は異なるもののその上下の波が気温(赤)とほぼ同じような動きになっていることが図から見て取れます。つまり(当然の話ですが)、氷の買物指数は気温と深く関わっているということが分かります。
データをもう少し細かく見てみると、他にも分かることがあります。買物指数が低い冬場に一時的に買物指数がその前後に比べて高くなるタイミングがあります。これは詳しく調べると年末年始を含む週のデータです。家族親戚などが一同に会して食事をするときのためでしょうか、気温との関係とは別に正月は一時的に氷の需要が伸びるようです。
正月と並んでお盆休みも、家族親戚等が集まって食事をする機会です。気温と関係なく買物指数が跳ね上がる可能性がありそうですが、たまたま今回のデータでは気温のピークの時期とほぼ重なっているため、お盆休みの週に買物指数が跳ねたかどうかは判然としません。特に昨年2020年は新型コロナウイルス感染拡大の影響で、お盆休みに故郷に帰省する人の割合が例年より少なかったことでしょうから、一層傾向が捉えにくくなっているのかもしれません。
1℃上昇したら売上はいくらアップする!?一歩進んで「散布図」を見てみよう!
続いて、気温を横軸に、購入金額を縦軸にして、両者の関係をプロットしていく散布図(図2)を見てみます。
このグラフの形状から読み取れることを以下に箇条書きでまとめてみました。意外と色々なことが分かるんです。
- 右肩上がりのプロットになっていて、気温が高ければ高いほど買物指数も大きくなる。
- ただし、プロットは直線的になっているわけではなく少し湾曲している。需要予測式を立てる際は、一次関数で近似するのではなく、他の関数(指数関数など)を使って近似したほうがより需要予測の精度が高まる。
- カテゴリによっては気温が上がりすぎると買物指数が横ばいか減少に転じる場合があるが、「氷」ではその現象は見られない。
- プロットのばらつきが少ない。季節にほとんど関係なく最高気温を指定すれば買物指数が分かる。(つまり最高気温が○℃の時の買物指数はおよそ△円と容易に推定できる)
指数関数で近似する場合、Y=ax(aのx乗)という式で考えるのが一般的です。コンピューターのソフトを使えば、式にx(この場合は気温)を代入したときのY(この場合は買物指数)は自動的に計算されるので楽ですが、自分の手元あるいは頭の中で暗算によって計算をするのは困難です。指数関数による近似を使わずに計算したい場合は、温度帯に分けて一次関数で近似すると良いでしょう。例えば20℃以下の温度帯での需要予測式、20~30℃の温度帯での需要予測式、30℃以上の温度帯での需要予測式といった感じです。そうすれば20℃以下の温度帯では気温が1℃上昇するごとに購入金額が約○円増える、20~30℃の温度帯では同じく約□円増える、…という感じで、計算がやさしくなります。
さて12月を示す水色のプロットのうち、プロットの集中しているゾーンから外れたデータが2つほどあります。これは前段で解説したとおり正月を含む週(その週のスタートの日付が12月だったため12月のプロットとして現れています)のデータです。気象だけでは説明できない異常値ですが、逆に考えると、この差分が、正月に家族親戚等が集まる際の買物指数押し上げ効果相当分と捉えることができます。この2つのデータも含んだ状態で需要予測式を立てようとすると、その影響を受けて予測の精度が低下してしまいます。一般に需要予測式を立てる際はこのような異常値として取り除く処理が必要となります。
異常値を取り除いて精度アップ
需要予測式を立てる場合、このような気象条件以外の要因と思われる異常値を取り除く処理を行うことで、気象要素と買物指数の関係がより明確になり、需要予測の精度を高めることができます。今回のように目で見てはっきり分かるデータで、かつ異常値のサンプル数が少ない場合は手作業で取り除くことができますし、その方法が確実です。
しかし異常値と考えられるサンプル数が多い場合や、異常値なのか通常の気象変化の影響の範囲内での変動か区別しづらい値となる場合などもあります。その場合は統計学の専門的な話になりますが、データにおける標準偏差を計算し、値が標準偏差に対して一定の割合以上となったデータは取り除くという処理を行います。ここでは異常値となりやすい例を紹介します。
異常値となりやすい事象 |
・期間限定特売(キャンペーン、売価変更など) ・近隣で開催された大型イベント ・消費税率の変更等による駆け込み需要とその後の反動 ・年中行事(年末年始、節分、バレンタインデー、母の日、お盆休み、…など) ・異常気象、自然災害(台風、大雪、集中豪雨、大地震、…など) |
今年の氷需要に期待
まとめとして、今年の氷需要についてシミュレーションしてみましょう。図2で示した散布図をベースに目測で考えます。昨年2020年7月の東京における最高気温の月平均値は27.7℃でした。これは平年値29.2℃(※1)に比べて1.5℃低い値です。これを氷需要に換算して考えると、例年であればおよそ170~180万円程度の買物指数が、2020年は150万円程度にとどまったことになります。今年、仮に気温が平年を上回り最高気温の平均値が30℃になったとしたら予想される買物指数は200万円程度、前年に比べて1.3倍超の伸びになります。今年の7月、氷需要の伸びに期待したいところですね。
※1 2011年~2020年に用いられた平年値。現在(2021年~2030年)の平年値は29.9℃。
本ブログに対するご意見、ご感想があれば是非こちらまでお寄せください。可能な限りお答えいたします。
株式会社True Data 流通気象コンサルタント 常盤 勝美
〈プロフィール〉
大学で地球科学を学び、民間の気象会社で約20年にわたりウェザーマーチャンダイジング関連サービスに従事。2018年6月、True Dataへ入社し、気象データマーケティングを推進。著書に『だからアイスは25℃を超えるとよく売れる』(商業界)など。気象予報士、健康気象アドバイザー、地球温暖化防止コミュニケーター。