実際にデータ分析をする時に相関関係なのか、因果関係なのか、どのように科学的に判別すればよいか再確認していきましょう。
実際にデータ分析をする時に相関関係なのか、因果関係なのか、どのように科学的に判別すればよいか再確認していきましょう。
相関関係の判定方法
相関関係はデータ分析で簡単に判定することができます。
データ間の関係性だけ分かればよいので、相関分析という手法を使うことで判別できます。
相関分析ではp値というものが算出されますが、一般的にp値が0.05(5%)を下回っていれば有意に相関関係があることを示すことができます。またp値と合わせてr値(相関係数)を算出することで、「正の相関関係、負の相関関係のどちらなのか」「どれくらいの強さの相関関係なのか」も知ることができます。
ちなみに相関係数が-1から1の間の値をとり、1に近づけば近づくほど強い正の相関があり、-1に近づけば近づくほど強い負の相関があると解釈します。相関がない場合は、相関係数が0となります。
因果関係の判定方法
相関関係と違い、因果関係の判定をデータ分析の結果のみで行うことは困難です。
なぜならデータ分析から分かるのは要素間の双方向の関係性(相関関係)だけだからです。
しかし本当に知りたいのは相関関係ではなく、因果関係である場合は多くあります。
手持ちのデータから因果関係まで推測しなければいけない場合に、因果関係を判定する方法を説明していきましょう。
基本的には相関関係が示された要素を見比べ、理論的に考察をして因果関係を判定していきます。
要素間の因果関係に理論が成り立つのであれば、因果関係があると判定する場合が多いです。(厳密な因果関係の証明方法は後ほど紹介します)
例えば気温とアイスクリームの販売数の相関関係が示されたのであれば、気温が原因でアイスクリームの販売に影響を与えることは理屈上、十分考えられる内容であるため、因果関係を表していると判断してしまってよいと言えます。
このように確実な方法ではありませんが、考察をすることで因果関係を推定できるケースはよくあります。
しかし先ほどの失敗例①のように、訪問回数と契約率の間に因果関係があるかどうかは考察だけで断定しきれません。
一番簡単な解決方法としては、実際の営業担当者にヒアリングなどを行い推測した因果関係が妥当であるかどうか確認するのが良いでしょう。
それが難しい場合、またはそれでも分からない場合は、少し大変ですが特殊なテストで因果関係を証明していく必要があります。