例題 排泄ケアの患者満足度に関する度数の検定
度数の検定に関する例題を以下に示します。度数の検定は、カテゴリカルな変数や質的なデータに対して、観測度数と期待度数の差異を評価するための統計検定です。
例題
排泄ケアの患者満足度に関する度数の検定
ある病院で排泄ケアの患者満足度を「非常に満足」「満足」「普通」「不満」というカテゴリーで評価しています。ある期間において、実際の観測度数と期待度数が異なるかどうかを検定します。
データ
観測度数(実際のデータ)
• 非常に満足 30人
• 満足 45人
• 普通 20人
• 不満 5人
期待度数(仮定的な期待度数)
• 各カテゴリーにおいて、全体の患者数に基づいて期待される度数を計算(例えば、各カテゴリーの割合をかけて総患者数で調整)
•全体の患者数が 100 人だと仮定した場合
度数の検定を行うためには、観測度数と期待度数の差異を評価する統計検定が必要です。代表的な統計検定の一つとして、カイ二乗検定 (Chi-square test) があります。カイ二乗検定は、カテゴリカルな変数の分布が期待と異なるかどうかを評価するための統計検定です。
以下は、Pythonでのカイ二乗検定の手順と計算例です。まず、SciPyライブラリを使用します。
from
scipy.stats import chi2_contingency
#
観測度数
observed_values
= [[30, 45, 20, 5]]
#
期待度数の仮定(等頻度度数分布を仮定)
total_observed
= sum(observed_values[0])
expected_values
= [[total_observed / len(observed_values[0])] * len(observed_values[0])]
#
カイ二乗検定の実行
chi2,
p, _, _ = chi2_contingency(observed_values, correction=False)
#
結果の出力
print(f"カイ二乗値 {chi2}")
print(f"P値 {p}")出力結果
出力結果
カイ二乗値 0.0
P値 1.0
ここで、expected_very_satisfied、expected_satisfied、expected_normal、expected_unsatisfiedは各カテゴリーの期待度数です。これらの期待度数は、全体の患者数が100人だと仮定して計算されます。
結果の P値 が有意水準(通常は0.05)以下であれば、観測度数と期待度数には統計的な差があると考えることができます。差がある場合、どのカテゴリーがその差に寄与しているかについては、追加の検定や検証が必要です。
仮に差がある場合、どのカテゴリーがその差に寄与しているかについては、追加の検定や検証が必要だが、これらのコードを示し、解釈方法を教えてください。
カイ二乗検定で差がある場合、どのカテゴリーがその差に寄与しているかを特定するためには、残差分析 (residual analysis) を行います。残差は観測度数と期待度数の差を示し、大きな残差は差の大きなカテゴリーを示唆しています。
以下は、Pythonで残差分析を行うコードの例です。
from
scipy.stats import chi2_contingency
#
観測度数
observed_values
= [[30, 45, 20, 5]]
#
カイ二乗検定の実行
chi2,
p, _, _ = chi2_contingency(observed_values, correction=False)
#
期待度数の計算
expected_values
= chi2_contingency(observed_values)[3]
#
残差の計算
residuals
= (observed_values - expected_values) / expected_values
#
各カテゴリーの残差を出力
categories
= ["非常に満足", "満足", "普通", "不満"]
for
i, category in enumerate(categories)
print(f"{category}
残差 = {residuals[0][i]}")
出力結果
非常に満足 残差 =
0.0
満足 残差 =
0.0
普通 残差 =
0.0
不満 残差 =
0.0
このコードでは、各カテゴリーの残差を計算しています。残差が大きなカテゴリーほど、そのカテゴリーが差に寄与している可能性が高いです。
解釈方法として、残差が0より大きい場合 観測度数が期待度数より大きいことを示し、そのカテゴリーが差に寄与している可能性が高い。残差が0より小さい場合 観測度数が期待度数より小さいことを示し、そのカテゴリーが差に寄与している可能性が高い。ただし、絶対値が大きい残差が重要です。例えば、残差が0.2よりも2.0の方が差の影響が大きいです。