医療統計学入門① ~検定の選び方~

看護研究

統計の全体図を見てみよう

統計学的手法を決定するには、5つの要件を確認する必要があります。
Q1. データの種類が名義尺度か、その他 (順序・間隔・比例) か
Q2. 対応がある (同一被検者から得られたデータ) か
Q3. 正規性がある (正規分布に従う) か
Q4. 2群比較か、3群以上の比較か
Q5. 等分散性があるか
この5つの要件を基に枝分かれしていき、最終的な統計学的手法を決定するイメージです。
次の章からは、この5つの要件について詳しく解説していきます。

Q1. データの種類について

質/量の分類尺度の種類説明
質的データ (カテゴリデータ)名義尺度データをグループ名によって分けたもの。グループ間で大小関係はない。
例) 血液型
A型とB型で大小関係はない
順序尺度データを順番によって分けたもの。大小関係はあるが、等間隔ではない。
例) 成績の順位
1位と2位、2位と3位の間隔は一定ではない
量的データ間隔尺度データの間隔は等間隔だが、比例関係はない。
例) IQ
IQ200の人はIQ100の人の2倍頭がいいわけではない
比例尺度データに比例関係がある。
例) 身長
身長200cmの人は100cmの人の2倍頭がいい

Q2. データの対応について

対応がある場合
同一グループからデータを取った場合。
例) 3年生の数学のテストについて、4月と9月の結果を比較する
 → 2回のデータは同じ3年生から取っているので「対応あり」

対応がない場合
別々のグループからデータを取った場合。
例) 1年生と3年生のマラソンのタイムを比較する
 → 別々の学年からデータを取っているので「対応なし」

Q3. データの正規性について

正規分布とは何か
例えば身長は、平均付近の人数が多く、身長が高い人数・低い人数は徐々に減っていきます。

このような山なりのグラフのことを正規分布といいます。
正規性を調べるためには、サンプルサイズが200以下の場合はShapiro-Wilkの検定を、2000より大きいときはKolmogorov-Smirnov Lilleforsの検定を行います。
帰無仮説は「グラフが正規分布する」なので、p値が0.05以上の時は「正規性がある=正規分布に従う」となります。
ちなみに、正規分布に従って行う検定方法をまとめてパラメトリック、正規分布が使用できない場合の検定方法をまとめてノンパラメトリックといいます。

Q4. 群数について

今回紹介している検定は、グループの平均値や中央値を比べる方法です。
そのグループ数 (群数) が2つの場合と、3つ以上の場合で検定方法が異なります。

例1) 3年生の数学のテストについて、4月と9月の結果を比較する
 → 2群比較なので「対応のあるt検定」
例2) 3年生の数学のテストについて、4月と9月と12月の結果を比較する
 → 3群比較なので「反復測定分散分析」

Q5. 等分散性について

対応のない群間比較で、正規性を持っている場合、分散が等しいか否かで検定方法が変わります。
等分散の検定はいくつかありますが、2群比較の場合はF検定、3群以上の比較の時はBartlett検定でよいでしょう。
等分散でない場合は、t検定または分散分析するためにデータを調整します(解析ソフトが調整してくれます)。

練習問題をしてみよう!

以下の実験例はどの検定を用いて解析すべきか答えよ。
例1: 男女の違いと身長に関連性があるかを調べる。
例2: 1年生と2年生のテスト結果は正規性を認めなかった。2学年のテスト結果を比較する。
例3: 1年生と2年生のテスト結果は正規性を認めた。2学年の分散は等しい時、2学年のテスト結果を比較する。
例4: 1年生の4月・6月のテスト結果は正規性を認めなかった。2回のテスト結果を比較する。
例5: 1年生の4月・6月・8月のテスト結果は正規性を認めなた。3回のテスト結果を比較する。

【答え】
例1: 男女 (=名義尺度) であり、それぞれからデータを取る (対応はない) のでカイ二乗検定
例2: テストの点は名義尺度ではなく、2学年からデータを取るので対応はなし。正規性のない2群比較なのでマンホイットニーのU検定
例3: 例2と同様に名義尺度以外で対応はなし。正規性のある2群比較なのでスチューデントのt検定
例4: 同一グループから2回データを取るので対応あり。正規性のない2群比較なのでウィルコクソンの符号順位和検定
例5: 同一グループから3回データを取るので対応あり。正規性のある3群比較なので反復測定分散分析

コメント

タイトルとURLをコピーしました