例題 次のランダムに選ばれた30人の患者の満足度データは正規分布に従っているか?
例題
次のランダムに選ばれた30人の患者の満足度データは正規分布に従っているか?カイ二乗検定のコードを作成し結果解釈方法を示して下さい。
75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,22075,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220
カイ二乗検定は、カテゴリカルなデータが与えられたときに、観測度数と期待度数の差異を評価するための統計検定です。質問にあるデータは連続的な数値のデータであり、正規分布に従っているかどうかを評価するためには他の方法が適しています。代わりに、シャピロ-ウィルク検定を使用して正規性を検定することができます。
以下は、Pythonでシャピロ-ウィルク検定を行うコードの例です。
from scipy.stats
import shapiro
# データ
data =
[75,80,85,90,95,100,105,110,115,120,125,130,135,140,145,150,155,160,165,170,175,180,185,190,195,200,205,210,215,220]
# シャピロ-ウィルク検定
statistic, p_value =
shapiro(data)
# 結果の出力
print(f'Shapiro-Wilk検定の統計量 {statistic}')
print(f'p-value
{p_value}')
# p-valueを用いて結果を解釈
if p_value > 0.05
print('データは正規分布に従っています(p > 0.05)')
else
print('データは正規分布に従っていない可能性があります(p <=
0.05)')
出力結果
Shapiro-Wilk検定の統計量
0.9574503898620605
p-value
0.2662297487258911
データは正規分布に従っています(p > 0.05)
このコードはSciPyライブラリを使用しています。結果のp-valueが0.05より大きければ、データは正規分布に従っている可能性が高いと解釈されます。