こんにちは。開発チーム 加藤です。
今回はマーケティング調査などデータの分析に便利なExcelのCORREL関数をご紹介します。
2つのデータの相関関係を求めるCORREL関数
マーケティングでまず行うことは市場調査・分析です。その際、必ずと言っていいほど、数字を扱います。この数字とこの数字は関係があるのか?と考えることも多いと思います。そんなときに便利なのが2つのデータの相関関係を求めるCORREL関数です。
CORREL関数は2つのデータを比較し、相関関係が高いほど数値が大きくなります。
今回は気象庁の過去の気象データを例にご説明していきます。
大阪の2024年の平均気温と月の最高気温の表になります。月平均気温と月最高気温の間に相関関係があるのかCORREL関数で調べます。
=CORREL(配列1,配列2,)
2行目と3行目の相関関係を求めます。
=CORREL(B2:M2,B3:M3) と関数を入れます。B2:M2は月平均気温、B3:M3は月最高気温になります。
数値は0.9803となりました。平均気温と最高気温の相関関係ですのでかなり高い数値になりました。
幾つかのデータを比較してみる
では他の気象データからどのようなことが分かるかみてみます。
こちらは大阪の月平均気温と平均湿度です。
相関関係は0.7326で平均気温と最高気温の相関関係に比べて低いです。
次に東京の月平均気温と平均湿度です。
こちらは大阪の数値よりかなり高くなります。
これらのデータを相関関係の数値から読み解くと、「大阪より東京の方が気温が低い時は湿度も低く、気温が高い時は湿度も高くなりやすい」ということが分かります。
グラフで可視化する
月平均気温と月平均湿度の数値を選択し、挿入>グラフ>散布図を選択して挿入します。
するとこのようになりました。(横軸が気温、縦軸が湿度になります)
大阪のグラフは上下の幅は少ないですが、東京のグラフはキレイに左下から右上に斜めに上がっています。
大阪は「気温が高くても低くても湿度はそれほど変わらない」ということに対して、東京は「気温が高ければ湿度も高く、気温が低ければ湿度も低い」ということが一目でわかり、東京の方が月平均気温と月平均湿度の相関関係が高いことがより良くわかります。
CORREL関数では相関関係が見えてこないことも
次に大阪のある場所の月の電気使用量と大阪の月平均気温を表したグラフで見ていきます。(電気使用は空調以外も含みます)
こちらは相関関係0.4191と上記のものに比べてかなり低いです。月の電気使用量と月平均気温の間には相関関係が無いように見えます。
では電気使用量と月平均気温の値を使い、散布図を作成してみます。(縦軸が気温、横軸が電気使用量になります)
このように「C」の字のように折れ曲がったグラフになりました。
つまり、気温が高くても低くても電気使用量が上がり、気温が15-20℃の間が一番電気の使用を抑えられるということが見てとれます。
CORREL関数では相関関係の数値が低く相関関係があまり無いと思っていた2つのデータでも、散布図にすると相関関係が読み取れる場合もあります。
さいごに
いかがでしたでしょうか。今回は相関関係を簡単に出せるCORREL関数をご紹介させていただきました。
マーケティング調査は数値など様々なものを比較分析するところから始まります。CORREL関数でだけでデータをみると偏りが生じたり重大な事項を見落とす可能性がありますが、一つの指標にするには良い関数だと思います。
もちろんマーケティング調査の以外にも、売上予測や来客予測などデータを比較する業務はたくさんあり、様々な場面で役に立つ関数ですので知っておいて損はないかと思います。
今回ご紹介しましたCORREL関数の他にも役に立つ関数はたくさんあります。今後も様々なEXCEL術のご紹介をさせていただけたらと思います。