推測統計と記述統計の違い
【推測統計と記述統計の違い】
推測統計では、データに基づいて推論や予測を行いますが、記述統計では、データ収集の特性を要約します。記述統計は、データの概要を示し、通常、表、グラフ、または要約統計で示されます。推測統計は、母集団に関する推定値や確率を提供し、通常、仮説検定や信頼区間、効果量として報告されます。つまり、推測統計はサンプルデータに基づいて母集団について推論するのに対し、記述統計はデータを要約して特徴付けるために用いられます。
推測統計学は、より少ないサンプルからの情報を当てはめ、より大きな集団について予測し、結論を導き出すための統計技術を使用します。確率論や統計モデルを用いて、サンプルデータに基づいて母集団のパラメータを推定し、母集団の仮説を検証するものです。推測統計の主な目的は、サンプルデータを用いて母集団全体に関する情報を提供し、導き出される結論をできるだけ正確で信頼できるものにすることです。
推測統計の主な用途は、「データから将来の推計値を提供すること」「理論を検証して、集団について結論を出すこと」があります。研究者は、推測統計と代表サンプルを利用することで、集団を一般化することができます。結論に至るには、論理的な推論が必要です。その結果を導き出す方法の手順を次に示します。
先ずは、調査対象となる母集団から一部サンプルを抽出する必要があります。この場合、母集団の性質や特徴をサンプルに反映させる必要があります。サンプルの行動を分析するために、推論統計学的手法を使用します。回帰分析や仮説検定に使われるモデルなどがこれにあたります。ファーストステップサンプルは、結論を出すために使用します。母集団全体についての仮定や予測を用いて、推論を行います。
推論統計学の種類は、仮説の検証と回帰分析のカテゴリーに分けられます。研究者は、小さなサンプルに基づいて、より大きな集団に結果を一般化するために、これらの方法を頻繁に使用します。
また、仮説を検証し、サンプルデータから母集団に関する一般論を導き出すことは、推測統計の一例です。帰無仮説と対立仮説を立て、統計的有意差検定を行うことが必要です。仮説検定は、左側、右側、または両側の分布を持つことができます。検定統計量の値、臨界値、信頼区間を用いて、結論を出します。以下、推測統計学で採用される重要な仮説検定をいくつか見てみましょう。
①
Z検定は、データが正規分布で、サンプルサイズが30以上の場合、z検定が適用されます。母分散がわかると、標本平均と母平均が等しいかどうかを判断します。
②
T検定は、サンプルサイズが30未満で、データがスチューデントのt分布である場合、t検定が利用されます。母集団の分散が不明な場合に、標本平均と母集団平均を比較します。
③
F検定は、2つの標本や集団の分散を比較する場合、差があるかどうかを調べるためにf検定が使われます。
④
信頼区間については、母集団のパラメータの推定を補助します。例えば、95%信頼区間とは、新鮮なサンプルを用いて同一の条件でテストを行った場合、100回中95回が指定された範囲内に推定値が収まることを意味します。また、信頼区間は、仮説検定における決定的な値を決定するために使用することができます。これらの検定に加え、推測統計学ではANOVA検定、Wilcoxon signed-rank検定、Mann-Whitney U検定、Kruskal-Wallis検定、H検定などが用いられます。
回帰分析は、ある変数が他の変数との関係でどのように変化するかを計算するために行われます。線形回帰、重回帰、ロジスティック回帰など、多数の回帰モデルを使用することができます。推測統計学では、特に線形回帰が最も一般的に使用されます。独立変数の単位変化に対する従属変数の応答を、線形回帰によって調べます。これらは、推測統計学を用いた回帰分析に欠かせないいくつかの式です。また、回帰係数については、直線の式は、y=α+βxで与えられ、αとβは回帰係数です。