因果関係を証明したい時はどうすればよいか?
因果関係を証明したい時はどうすればよいか?
RCT(ランダム化比較試験)
データ分析だけで因果関係を証明したい場合、基本的にはRCT(ランダム化比較試験)と呼ばれるテストが必要になります。
RCTはマーケティングの分野でABテストと呼ばれることもあります。
ランダム化比較試験とは特別な介入をする人としない人をランダムに選定し、介入群と非介入群で最終効果を比較する方法です。
先ほどの失敗例①ですと、一部の地区で訪問回数を増やす顧客と今まで通りの対応をする顧客をランダムに2群に分け、最終的な契約率を2群間で比較することで訪問回数と契約率の因果関係を証明することができます。
このようなテストを事前に行っておくと、因果関係の失敗をするリスクを下げることができます。
RCTを行うのは確かに手間がかかりますが、リスクの高い施策を決定する際はRCTで事前に因果関係を検証しておくことが不可欠です。
傾向スコア分析
因果関係を示す最適な方法は先ほど紹介したRCTですが、時間的な問題や倫理的な問題でRCTが実行できない場合があります。
この場合は傾向スコア分析と呼ばれるものを使って因果関係を証明することが出来る場合があります。
傾向スコア分析について簡単に説明していきましょう。
先ほどの失敗例①では、訪問回数が多い人たちと少ない人達で契約してくれそうな確率がそもそも異なっていたことが問題でした。
そのため、初期接触の時の感触(今後契約してくれそうかどうか)が同じだった人たちだけで比較してその問題を解消してしまおうという考え方が、傾向スコア分析の基本的な考え方です。
まずは今後の訪問回数に影響するデータをなるべく網羅的に収集します。
この時にデータの抜けがあると傾向スコア分析が上手く行えませんので、注意が必要です。
次に、そのデータを使ってロジスティック回帰分析などで訪問回数が多くなりそうか、少なくなりそうか一人ずつ予測します。
最後にその予測値が同じまたは近い者同士でペアにして、実際の訪問回数と契約率の間に相関があるか比較します。
事前に今後の訪問回数に影響する要素を統一した上で比較を行うことになるので、ここで相関が認められれば因果関係があると判定できることになります。
ただし傾向スコア分析は必要なデータが全て揃っていることが前提の解析であり、そこに少しでも誤りがあると間違った結果を出してしまうリスクがあります。
ランダム化比較試験が行える場合は、なるべくそちらの方法で因果関係を確かめるようにしましょう。