どんな時に使うの?
カイ二乗検定は2種類ある
① 独立性の検定: 2つの群における2つの事象が独立である (= 関連がある) ことを検定する。
例) 性別と車好きに関連があるか?
② 適合度の検定: いくつかの群の振り分けが適合しているか (= 理想的な確率になっているか) を検定する。
例) 1学年からランダムに10人選んだ時、A型: 6人、B型: 2人、O型: 1人、AB型: 1人となった場合、偏りがないといえるか?
JMPを用いたカイ二乗検定の実際
① データをセットする
【ファイル】→【開く】でexcelのデータファイルを選択する
② ワークシートを選択する
【ワークシート】の選択→【読み込み】でワークシートを選択する
③ 分析方法を選択する
【分析】→【二変量の関係】を押す
④ 目的変数・説明変数を選択する
列の選択から【Y, 目的変数】→【X, 説明変数】を選択→【OK】を押す
⑤ 必要に応じて解析結果の表示を増やす
【赤い▼】を押して必要な項目を選択する
結果は何を意味しているの?
① モザイク図と分割表
モザイク図: 分割表を面積で表現した図。各セルの大きさを視覚的に表現したもの。
分割表: 度数 (各セルに該当する人数)、全体% (全体に対する各セルの割合)、列% (縦方向に対する各セルの割合)、行% (横方向に対する各セルの割合)
② 検定
N: 全体のサンプルサイズ。
自由度: 分割表の (縦マス数-1) × (横マス数-1)。今回であれば (2-1)×(2-1)=1。
(-1)*対数尤度: 帰無仮説「性別と車好きに関連はない」を検証した値。差が小さいほど帰無仮説が正しいことを示す。
R2乗 (U): 性別 (説明変数) が車好きか (目的変数) をどの程度説明できるかを表した値。1に近いほど説明できていることを示す。
尤度比: (-1)*対数尤度を2倍したもの。この値と自由度を基に、カイ二乗分布図からp値を算出している(あまり使わない)。
Pearson: 一般的に使用されるカイ二乗検定の統計量で、この値と自由度を基に、カイ二乗分布図からp値を算出している。
p値: 帰無仮説「性別と車好きに関連はない」が成立する確率。この確率が0.05以下であれば帰無仮説「性別と車好きに関連はない」は成立しないと考える (=独立)。
Fisherの正確検定: ほぼカイ二乗検定と同じもの。分割表にある各セルのうち、1つでも度数が5以下のセルがあればカイ二乗検定ではなくFisherの正確検定を実施する。
論文への書き方
性別と車好きの関係についてカイ二乗検定を行った結果、有意差は認められなかった (χ2(1)=0.625, p=0.429)。
※ χ2(1) の (1) は自由度を表します。
コメント