M60-01 대응된 두 집단의 모평균 비교 - 등분산가정 : 대응표본 t검정

대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 $t$검정

새로운 확률변수

 

$D = X_2 – X_1 $

 

여기서, 확률변수  $X_2$와 $X_1$의 확률변수값은 대응됨

 

새로운 확률변수의 표본집합의 원소

 

$d_i = x_{i2} – x_{i1}$

 

여기서, $i$는 1부터 표본크기 $n$까지를 나타내는 양의 정수

 

새로운 확률변수($D$)의 평균($\mu_D$)

 

$\mu_{D} = \mu_{X_2} – \mu_{X_1}$

 

여기서,  $\mu_{X_1}$, $\mu_{X_2}$는 두 집단의 모평균

 

새로운 확률변수($D$)의 분산

 

$\sigma_D^2=\mathrm  Var(D)=\mathrm Var({d_i})$

 

새로운 확률변수의 표본평균($\bar D$)의 기대값, ${\rm E}(\bar D)$

 

$\bar D = {\bar X}_2 – {\bar X}_1$

 

여기서,  $\bar X_1$, $\bar X_2$는 집단의 표본평균

 

확률변수($\bar D$)의 기대값은 두 집단의 모평균의 차이

 

${\rm E}(\bar D) = \mu_{\bar D} = \mu_{D} = \mu_{X_2} – \mu_{X_1}$

 

여기서,  ∼ 는 점추정(point estimation)

$\mu_{D}$ 는 새로운 확률변수의 모평균

$\mu_{X_1}$, $\mu_{X_2}$는 집단의 모평균

 

표본평균 표집의 모분산

 

${\rm Var}(\bar {D}) = {\rm Var}(\overline {d_i}) =   \dfrac{\sigma_{D}^2}{n}$

 

여기서,  ∼ 는 점추정(point estimation)

$\sigma_{D}^2$ 새로운 확률변수의 모분산

 

대응표본( $d_i$)의 평균($\bar D$ or $\overline {d_i}$)

 

$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$

 

여기서,  $n$은 표본크기

 

확률변수($D$)의  표본평균($\bar D$)의 분산, ${\rm Var}(\bar {D})$

 

$\mathrm Var(\bar {D}) = \mathrm Var(\overline {d_i}) =   \dfrac{\sigma_{D}^2}{n}$

 

여기서,  $n$은 표본크기

 

대응표본모분산의 점추정량인 대응표본분산(${S_D}^2$)의 계산값

 

$S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$

 

여기서,  $n-1$은 자유도

 

대응표본평균의 표준오차(Standard Error of Mean)

 

${\rm SE}(\bar D)=\sqrt{{\rm Var}(\bar D)}= \sigma_{\bar D} = \sqrt{\dfrac{\sigma_D^2}{n}}∼\sqrt{\dfrac{S_D^2}{n}}=\dfrac{S_D}{\sqrt{n}}$

 

여기서,  $S_{D}^2 = \dfrac{\sum\limits_{i=1}^n {(d_{i}-\overline {d_i})^2}}{n-1}$

 

검정통계량

 

$t = \dfrac{(\bar X_2 – \bar X_1)-D_0}{\dfrac{S_D}{\sqrt{n}}}= \dfrac{\bar D -D_0}{\dfrac{S_D}{\sqrt{n}}}$

 

여기서,  $D_0$는 귀무가설에서 제시된 두 모평균의 차이

대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 t검정표

귀무가설$(H_0)$ 검정통계량의 값 대립가설$(H_1)$ 귀무가설 기각역
$$\mu_1-\mu_2=D_0$$ $$t=\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}$$ $$\mu_1-\mu_2\gt D_0$$ $$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\gt t_{n-1\ ;\ \alpha}$$
$$\ \mu_1-\mu_2\lt D_0$$ $$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\lt-t_{n-1\ ;\ \alpha}$$
$$\ \mu_1-\mu_2\ne D_0$$ $$\left|\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\right|\gt t_{n-1\ ;\ \frac{\alpha}{2}}$$

M60-02 대응비교를 위한 표본데이터와 표본통계량

대응비교를 위한 데이터와 통계량

대응비교를 위한 표본데이터와 통계량

집단 1의 표본데이터($x_{i1}$)

집단 2의 표본데이터($x_{i2}$)

통계량(대응 표본데이터 차이)

($d_{i}=x_{i1}-x_{i2}$)

$x_{11}$

$x_{21}$

$\cdots$

$x_{n1}$

$x_{12}$

$x_{22}$

$\cdots$

$x_{n2}$

$d_{1}=x_{11}-x_{12}$

$d_{2}=x_{21}-x_{22}$

$\cdots$

$d_{n}=x_{n1}-x_{n2}$

대응비교 통계량

$d_{i}$의 평균

$d_{i}$의 분산

$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$

$S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$

M60-03 독립된 두 집단의 모평균 비교 - 등분산가정 : 독립표본 t검정

독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정

두 모평균의 차이 $D_{0}$

 

검정통계량

 

$$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$

 

여기서,  $D_0$는 귀무가설에서 제시된 두 모평균의 차이

$S_p^2$는 통합표본분산(pooled variation) : $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$

 

독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\mu_2 – \mu_1=D_0$

$$t=\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$

 

여기서,  $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$

$\mu_2 – \mu_1 > D_0$ $\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}<-t_{n-2\ ;\ \alpha}$
$\mu_2 – \mu_1 < D_0$ $\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}>-t_{n-2\ ;\ \alpha}$
$\mu_2 – \mu_1 \ne D_0$ $\left|\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}\right|>-t_{n-2\ ;\ \frac{\alpha}{2}}$

M60-04 독립된 두 집단의 모평균 비교 - 등분산이 아닌 경우 : 웰치 t검정

독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정

검정통계량

$$\dfrac{\bar{X}_1-\bar{X}_2}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$

자유도

$$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$

독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$$\mu_1-\mu_2=D_0$$

$$t=\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$

 

여기서, $$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$

$$\mu_1-\mu_2\gt D_0$$ $$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\gt t_{\nu \ ;\ \alpha}$$
$$\mu_1-\mu_2\lt D_0$$ $$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\lt t_{\nu \ ;\ \alpha}$$
$$\mu_1-\mu_2\ne D_0$$ $$\left|\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\right|\gt t_{\nu \ ;\ \frac{\alpha}{2}}$$

M60-05 독립된 두 집단의 모분산 비교 - 정규분포가정 : 독립표본 F검정

독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 $F$검정

$$F=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$

 

$$F_{(n_1-1), (n_2-1)}=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$

 

여기서, $n_1$과 $n_2$은 표본의 크기

$F_{(n_1-1), (n_2-1)}$는 두 모수 $(n_1-1), (n_2-1)$를 가지는 $F$확률분포

$S_1^2$, $S_2^2$는 두 표본분산

$\sigma_1^2$, $\sigma_2^2$는 두 모분산

 

 

검정통계량

 

$$F = \dfrac{S_1^2}{S_2^2}$$

 

귀무가설

 

$H_{0}\ :\ \sigma_{1}^{2}=\sigma_{2}^{2}$

 

독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 F검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$$\sigma_1^2=\sigma_2^2$$ $$F=\dfrac{S_1^2}{S_2^2}$$ $$\sigma_1^2\gt\sigma_2^2$$ $$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
$$\sigma_1^2\lt\sigma_2^2$$ $$\dfrac{S_1^2}{S_2^2}\lt\ F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
$$\sigma_1^2\ne\sigma_2^2$$ $$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;1-\frac{\alpha}{2}}$$ $$\dfrac{S_1^2}{S_2^2}\lt F_{n_1-1,\ n_2-1\ ;\ \frac{\alpha} {2}}$$

M60-06 독립된 두 집단의 모비율 비교 - 표본크기가 큰 경우 : Z검정

독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정

표준오차

 

$$\dfrac{\hat{p}_1-\hat{p}_2}{\sigma_{\hat{p}_1-\hat{p}_2}}$$

여기서,  $\sigma_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{p_1(1-p_1)+p_2(1-p_2)+2{p_1}{p_2}}{n}}∼\hat{p}_1-\hat{p}_2$

 

만일, $n_1 = n_2$이면

 

$$S_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{2\bar{p}}{n}}$$

 

여기서,  $\bar{p}=\dfrac{(\hat{p}_1+\hat{p}_2)}{2}$

 

검정통계량

 

$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$

 

여기서, $\bar{p}=\dfrac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}$

 

독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$$ p_1=p_2$$ $$Z=\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$ $$p_1\gt p_2$$ $$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\gt z_{\alpha}$$
$$p_1\lt p_2$$ $$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\lt -z_{\alpha}$$
$$p_1\ne p_2$$ $$\left|\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\right|\gt z_{\frac{\alpha}{2}}$$

M60-07 일원분산분석의 데이터구조와 기호

일원분산분석의 데이터구조와 기호

일원분산분석 데이터(One-way ANOVA data)

원인으로 구분 모평균 모분산 표본크기 표본 관측값 표본평균 표본분산
집단 1 $\mu_{Y_1}$ $\sigma_{Y_1}^2$ $n_1$ $\begin{array}{cccc}{{y}_{11}}&{{y}_{12}}&{\cdots}&{{y}_{1{n}_{1}}}\end{array}$ ${\bar{Y}}_{{1}\cdot}$ $S_{Y_1}^2$
집단 2 $\mu_{Y_2}$ $\sigma_{Y_2}^2$ $n_2$ $\begin{array}{cccc}{{y}_{21}}&{{y}_{22}}&{\cdots}&{{y}_{2{n}_{2}}}\end{array}$ ${\bar{Y}}_{{2}\cdot}$ $S_{Y_2}^2$
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
집단 $k$ $\mu_{Y_k}$ $\sigma_{Y_k}^2$ $n_k$ $\begin{array}{cccc}{{y}_{k1}}&{{y}_{k2}}&{\cdots}&{{y}_{k{n}_{k}}}\end{array}$ ${\bar{Y}}_{{k}\cdot}$ $S_{Y_k}^2$
원인으로 구분된 집단 관측값 평균
집단 1 $\begin{array}{cccc}{{Y}_{11}}&{{Y}_{12}}&{\cdots}&{{Y}_{1{n}_{1}}}\end{array}$ ${\bar{Y}}_{{1}\cdot}$
집단 2 $\begin{array}{cccc}{{Y}_{21}}&{{Y}_{22}}&{\cdots}&{{Y}_{2{n}_{1}}}\end{array}$ ${\bar{Y}}_{{2}\cdot}$
수준 $k$ $\begin{array}{cccc}{{Y}_{k1}}&{{Y}_{k2}}&{\cdots}&{{Y}_{k{n}_{1}}}\end{array}$ ${\bar{Y}}_{{k}\cdot}$

M60-08 일원분산분석 통계모형

일원분산분석 통계모형

$$\eqalign{Y_{ij}&=\mu_i + \varepsilon_{ij}\cr&=\mu +\alpha_i +\varepsilon_{ij}}$$

 

여기서,  $i=1,2,\cdots ,k$

$j=1,2,\cdots ,n_i$

M60-09 일원분산분석표

일원분산분석표

$$SS_T=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$

$$SS_{Tr}=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2$$

$$SS_E=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$

$$F_0=\dfrac{MS_{Tr}}{MS_E}=\dfrac{\dfrac{SS_{Tr}}{(k-1)}}{\dfrac{SS_E}{(n-k)}}$$

 

일원분산분석표

요인
(factor)
제곱합
(squared sum)
자유도
(degrees of freedom)
제곱평균
(mean squared)
$F$검정통계량
(F statistic)
처리
(Between)
$SS_{Tr}$ $k-1$ ${MS}_{Tr}=\dfrac{SS_{Tr}}{k-1}$ $F_{0}=\dfrac{MS_{Tr}}{MS_E}$
오차
(Within)
$SS_E$ $n-k$ $MS_E=\dfrac{SS_E}{n-k}$

(Total)
$SS_T$ $n-1$ $MS_T=\dfrac{SS_T}{n-1}$

M60-10 일원분산분석 F검정

일원분산분석 F검정

귀무가설

 

$$H_0 :\alpha_1=\alpha_2=\cdots=\alpha_k=0$$

 

대립가설

 

$H_1$ : 적어도 한 $\alpha_k$는 $0$이 아니다.

 

검정통계량

 

$$F_0=\dfrac{MS_{Tr}}{MS_E}$$

 

기각역

 

$$F_0>F_{k-1,n-k;\alpha}$$

 

사후검정

 

$$HSD_{ij}=q_{k,n-k;\alpha}\cdot\sqrt{\frac{1}{2}(\frac{1}{n_i}+\frac{1}{n_j})MS_{E}}$$

 

일원분산분석 F검정표

귀무가설$(H_0)$ 검정통계량의 값 대립가설$(H_1)$ 귀무가설 기각역
 $\alpha_1=\alpha_2=\cdots=\alpha_k=0$ $F_0=\dfrac{MS_{Tr}}{MS_E}$  적어도 한 $\alpha_k$는 $0$보다 크다. 검정통계량으로 $\alpha_k$가 0보다 큰지 알 수 없다.
적어도 한 $\alpha_k$는 $0$보다 작다. 검정통계량으로 $\alpha_k$가 0보다 작은지 알 수 없다.
적어도 한 $\alpha_k$는 $0$이 아니다. $F_0>F_{k-1,n-k;\alpha}$

M60-11 이원분산분석 통계모형

이원분산분석 통계모형

$$Y_{ijk}=\mu +\alpha_i +\beta_j +\gamma_{ij}+\epsilon_{ijk}$$

 

여기서,  $i=1,2,\cdots,a$

$j=1,2,\cdots,b$

$k=1,2,\cdots,r$

$\mu$ : 총평균
$\alpha_{i}$은 $A$의 $i$번째 수준의 효과
$\beta_{j}$은 $B$의 $j$번째 수준의 효과
$\gamma_{ij}$은 $A$의 $i$번째 수준과 $B$의 $j$번째 수준과의 교호작용효과
$\epsilon_{ijk}$은 오차항으로 서로 독립,  $N(0,\sigma^2)$을 따름

 

총제곱합($SS_T$) : 자유도는 $n-1$

$$SS_T=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{\ldots})^2$$

 

인자 A의 처리제곱합($SS_A$) : 자유도는 $a-1$

$$SS_A=br\sum_{i=1}^{a}(\bar{Y}_{i..}-\bar{Y}_{\ldots})^2$$

 

인자 B의 처리제곱합($SS_A$) : 자유도는 $b-1$

$$SS_B=ar\sum_{j=1}^{b}(\bar{Y}_{.j.}-\bar{Y}_{\ldots})^2$$

 

인자 A와 B의 교호작용효과를 나타내는제곱합($SS_{AB}$) : 자유도는 $(a-1)(b-1)$

 

$$SS_{AB}=r\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{Y}_{ij.}-\bar{Y}_{i..}-\bar{Y}_{.j.}+\bar{Y}_{\ldots})^2$$

 

오차제곱합($SS_E$) : 자유도는 $n-ab$

$$SS_E=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{ij.})^2$$

M60-12 이원분산분석의 제곱합과 자유도 분할

이원분산분석의 제곱합과 자유도 분할

제곱합과 자유도의 분할

 

제곱합

 

$$SS_T=SS_A+SS_B+SS_{AB}+SS_E$$

 

자유도

$$n-1=(a-1)+(b-1)+(a-1)(b-1)+(n-ab)$$

M60-13 이원분산분석표

이원분산분석표

이원분산분석표

요인
(factor)
제곱합
(squared sum)
자유도
(degrees of freedom)
제곱평균
(mean squared)
$F$검정통계량
(F statistic)
요인$A$
(factor A)
$SS_A$ $a-1$ ${MS_A}=\dfrac{SS_A}{a-1}$ $F_{1}=\dfrac{MS_A}{MS_E}$
요인$B$
(factor B)
$SS_B$ $b-1$ ${MS_B}=\dfrac{SS_B}{b-1}$ $F_{2}=\dfrac{MS_B}{MS_E}$
요인$A$와 요인$B$의 상호작용
(interaction effect of A, B)
$SS_{AB}$ $(a-1)(b-1)$ ${MS_{AB}}=\dfrac{SS_{AB}}{(a-1)(b-1)}$ $F_{3}=\dfrac{MS_{AB}}{MS_E}$
오차
(error)
$SS_E$ $n-ab$ ${MS_E}=\dfrac{SS_E}{n-ab}$  
전체
(total)
$SS_T$ $n-1$    

M60-14 상호작용(교호작용)효과에 대한 F검정

상호작용(교호작용)효과에 대한 F검정

귀무가설

 

$$H_0:\gamma_{ij}=0$$

 

여기서,  $i=1,2,\cdots,a$

$j=1,2,\cdots,b$

 

기각역

 

$$F_3=\dfrac{MS_{AB}}{MS_E}\gt  F_{(a-1)(b-1),n-ab;\alpha}$$

 

상호작용(교호작용)효과에 대한 F검정표

귀무가설$(H_0)$ 검정통계량의 값 대립가설$(H_1)$ 귀무가설 기각역
$\gamma_{ij}=0$ $F_3=\dfrac{MS_{AB}}{MS_E}$ $\gamma_{ij} > 0$ 검정통계량으로 $\gamma_{ij}$가 0보다 큰 지 알 수 없다.
$\gamma_{ij} < 0$ 검정통계량으로 $\gamma_{ij}$가 0보다 작은 지 알 수 없다.
$\gamma_{ij}\neq0$ $F_3\gt  F_{(a-1)(b-1),n-ab;\alpha}$

M60-15 원인 A의 주효과에 대한 F검정

원인 A의 주효과에 대한 F검정

귀무가설

 

$$H_0:\alpha_1=\alpha_2=\cdots=\alpha_a=0$$

 

기각역

 

$$F_1=\dfrac{MS_A}{MS_E}\gt F_{a-1,n-ab;\alpha}$$

 

원인 A의 주효과에 대한 F검정표

귀무가설$(H_0)$ 검정통계량의 값 대립가설$(H_1)$ 귀무가설 기각역
$\alpha_1=\alpha_2=\cdots=\alpha_a=0$ $F_1=\dfrac{MS_A}{MS_E}$ 적어도 한 $\alpha_a$는 0보다 크다. 검정통계량으로 $\alpha_a$가 0보다 큰 지 알 수 없다.
적어도 한 $\alpha_a$는 0보다 작다. 검정통계량으로 $\alpha_a$가 0보다 작은 지 알 수 없다.
적어도 한 $\alpha_a$는 0이 아니다. $F_1\gt F_{a-1,n-ab;\alpha}$

M60-16 원인 B의 주효과에 대한 F검정

원인 B의 주효과에 대한 F검정

귀무가설

 

$$H_0:\beta_1=\beta_2=\cdots=\beta_b=0$$

 

기각역

 

$$F_2=\dfrac{MS_B}{MS_E}\gt F_{b-1,n-ab;\alpha}$$

 

원인 B의 주효과에 대한 F검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\beta_1=\beta_2=\cdots=\beta_b=0$ $F_2=\dfrac{MS_B}{MS_E}$ 적어도 한 $\beta_b$는 $0$보다 크다. 검정통계량으로 $\beta_b$가 $0$보다 큰 지 알 수 없다.
적어도 한 $\beta_b$는 $0$보다 작다. 검정통계량으로 $\beta_b$가 $0$보다 작은 지 알 수 없다.
적어도 한 $\beta_b$는 $0$이 아니다. $F_2\gt F_{b-1,n-ab;\alpha}$

M60-17 중앙값의 부호검정 : Spearman rank test

중앙값의 부호검정 : Spearman rank test

중앙값의 부호검정표

귀무가설$(H_0)$ 검정통계량의 값 대립가설$(H_1)$ 귀무가설 기각역
$M=M_0$ $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$ $M> M_0$ $n_{+}> B{\left({n,0.5}\right)}_{\alpha}$
$M< M_0$ $n_{+}< B{\left({n,0.5}\right)}_{1-\alpha}$
$M\ne M_0$ $n_{+}< B{\left({n,0.5}\right)}_{1-\frac{\alpha}{2}}$ 또는 $n_{+}> B{\left({n,0.5}\right)}_{\frac{\alpha}{2}}$

M60-18 중앙값의 부호검정 - 표본크기가 큰 경우

중앙값의 부호검정 – 표본크기가 큰 경우

만약 관측값 중에 $M_0$와 동일한 값이 있으면 그 관측값은 검정에서 사용하지 않는다. 즉, $n$을 감소시킨다.

 

중앙값의 부호검정표 – 표본크기가 큰 경우

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$M=M_0$ $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$ $M> M_0$ $\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}> z_{\alpha}$
$M< M_0$ $\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}<-z_{\alpha}$
$M\ne M_0$ $\left|\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}\right|> z_{\frac{\alpha}{2}}$

M60-19 부호순위검정 통계모형

부호순위합검정 통계모형

$$X_i=M_0+\varepsilon_i$$

 

여기서,  $i=1,2,\cdots ,n$

M60-20 중앙값의 부호순위검정 : Wicoxon Signed rank test

중앙값의 부호순위검정 : Wilcoxon Signed rank test

$$\mathrm{E}[R_+]=\dfrac{n(n+1)}{4}$$

$$\mathrm{Var}[R_+]=\dfrac{n(n+1)(2n+1)}{24}$$

 

중앙값의 부호순위합검정표 : Wilcoxon rank-sum test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$M=M_0$ $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합 $M> M_0$ $R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$
$M< M_0$ $R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$
$M\ne M_0$ $R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$

M60-21 중앙값의 부호순위검정 - 표본크기가 큰 경우 : Wicoxon Signed rank test

중앙값의 부호순위합검정 – 표본크기가 큰 경우 : Wilcoxon Signed rank test

순위 $R_{+}$의 가능한 순위
1 2 3
$-$ $-$ $-$ 0
$+$ $-$ $-$ 1
$-$ $+$ $-$ 2
$-$ $-$ $+$ 3
$+$ $+$ $-$ 3
$+$ $-$ $+$ 4
$-$ $+$ $+$ 5
$+$ $+$ $+$ 6
$R_{+}=x$ 0 1 2 3 4 5 6
$P(R_{+}=x)$ ${{1}\over{8}}$ ${{1}\over{8}}$ ${{1}\over{8}}$ ${{2}\over{8}}$ ${{1}\over{8}}$ ${{1}\over{8}}$ ${{1}\over{8}}$

 

$$\mathrm{Var}[R_+]=\dfrac{1}{24}\left[n(n+1)(2n+1)-\dfrac{1}{2}\sum\limits_{j=1}^{g}t_{j}(t_{j}-1)(t_{j}+1)\right]$$

 

여기서,  $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

 

표본크기가 큰 경우 – 중앙값의 부호순위합검정(윌콕슨검정)표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$M=M_0$ $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합 $M> M_0$ $\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{>} z_{\alpha}$
$M< M_0$ $\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{<}-z_{\alpha}$
$M\ne M_0$ $\left|\dfrac{R_+ -E(R_+)} {\sqrt{V(R_+)}}\right|{>} z_{\frac{\alpha}{2}}$

M60-22 순위합검정 모형 : Wilcoxon rank-sum Model

순위합검정 모형 : Wilcoxon rank-sum Model

$$X_i=M_1+\varepsilon_i$$

 

여기서,  $i=1,2,\cdots, n_1$

 

$$Y_j=M_1+\Delta+\varepsilon_j$$

 

여기서, $j=1,2,\cdots,n_2$

$M_2=M_1+\Delta$

M60-23 순위합검정 : Wilcoxon rank-sum test

순위합검정 : Wilcoxon rank-sum test

$$\mathrm{E}[R_2]=\dfrac{n_2(n_1+n_2+1)}{2}$$

$$V(R_2)=\dfrac{n_1 n_2(n_1+n_2+1)}{12}$$

 

순위합검정표 : Wilcoxon rank-sum test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$M_1=M_2$ $R_{2}=’Y{\rm 표본에}\ {\rm 부여한}\ {\rm 순위합}’$ $M_1> M_2$ $R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\alpha}$
$M_1< M_2$ $R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\alpha}$
$M_1\ne M_2$

$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\frac{\alpha}{2}}$

또는

$R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\frac{\alpha}{2}}$

M60-24 대응비교를 위한 데이터와 통계량

대응비교를 위한 데이터와 통계량

대응비교를 위한 데이터와 통계량

모집단 1의 표본($x_{i1}$) 모집단 2의 표본($x_{i2}$) 차이 $d_{i}=x_{i1}-x_{i2}$
$x_{11}$ $x_{12}$ $d_{1}=x_{11}-x_{12}$
$x_{21}$ $x_{22}$ $d_{2}=x_{21}-x_{22}$
$\cdots$ $\cdots$ $\cdots$
$x_{n1}$ $x_{n2}$ $d_{n}=x_{n1}-x_{n2}$

M60-25 대응표본 - 부호순위합검정 : Wilcoxon Signed rank test

대응표본 – 부호순위합검정 : Wilcoxon Signed rank test

 

대응표본 – 부호순위합검정 : Wilcoxon Signed rank test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$M_d=0$ $R_{+}=’\left|{d_{i}}\right|\ {\rm 순위에서}+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$ $M_d> 0$ $R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$
$M_d< 0$ $R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$
$M_d\ne 0$ $R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$

M60-26 각 수준별 확률표본에 대한 기호

각 수준별 확률표본에 대한 기호

 

각 수준별 확률표본에 대한 기호

수준 1 수준 2 $\cdots$ 수준  
$X_{11}$ $X_{21}$ $\cdots$ $X_{k1}$
$X_{12}$ $X_{22}$ $\cdots$
$\cdots$ $\cdots$ $X_{k2}$
$X_{1n_{1}}$ $X_{2n_{2}}$ $X_{kn_{k}}$
수준 1 평균 수준 2 평균 $\cdots$ 수준  $k$평균 총평균
${\bar X}_{1\cdot}$ ${\bar X}_{2\cdot}$ ${\bar X}_{k\cdot}$ ${\bar X}_{\cdot\cdot}$

M60-27 비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

통계모형

$$X_{ij}=\mu+\tau_i+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots,n_i$$

 

여기서,  $\sum\limits_{i=1}^{k}\tau_i=0$

 

검정

 

귀무가설

 

$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$

 

대립가설

 

$H_1$  : 적어도 하나의 $\tau_i$는 $0$이 아니다

 

각 수준별 순위 데이터에 대한 기호

수준 1 수준 2 $\cdots$ 수준 $k$  
$R_{11}$ $R_{21}$ $\cdots$ $R_{k1}$
$R_{12}$ $R_{22}$ $R_{k2}$
$\cdots$ $\cdots$ $\cdots$
$R_{1n_{1}}$ $R_{2n_{2}}$ $R_{kn_{k}}$
수준 1 합 수준 2 합 $\cdots$ 수준 합
$R_{1\cdot}$ $R_{2\cdot}$ $R_{k\cdot}$
수준 1 평균 수준 2 평균 $\cdots$ 수준 평균 총평균
${\bar R}_{1\cdot}$ ${\bar R}_{2\cdot}$ ${\bar R}_{k\cdot}$ ${\bar R}_{\cdot\cdot}=\dfrac{(n+1)}{2}$

 

$$\eqalign{SS_T&=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(R_{ij}-\bar{R}_{\cdot\cdot})^2\cr&=\sum_{k=1}^{n}(k-\bar{R}_{\cdot\cdot})^2\cr&=n(n+1)(n-1)}$$

 

$$SS_{Tr}=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$

 

$$SS_T=SS_{Tr}+SS_E$$

 

$$\eqalign{F&=\dfrac{MS_{Tr}}{MSE}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SSE}{n-k}}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SS_T-SS_{Tr}}{n-k}}\cr&=\dfrac{\dfrac{n-k}{k-1}}{\dfrac{SS_T}{SS_{Tr}}-1}}$$

 

$$\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$$

 

비모수 분산분석 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_0$) 귀무가설 기각역
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$ $\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$ 적어도 하나의 $\tau_i$는 0보다 크다 검정통계량으로 $\tau_i$가 0보다 큰 지 알 수 없다
적어도 하나의 $\tau_i$는 0보다 작다 검정통계량으로 $\tau_i$가 0보다 작은 지 알 수 없다
적어도 하나의 $\tau_i$는 0이 아니다 $H>h(n_{1},\ n_{2},\ \cdots ,\ n_{k})_{\alpha}$

M60-28 비모수 분산분석 - 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

 

$$H’=\dfrac{H}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{n^3-n}}$$

 

여기서,  $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$

 

비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$ $H$ 적어도 하나의 $\tau_{i}$는 0보다 크다 검정통계량으로 $\tau_{i}$가 0보다 큰 지 알 수 없다
적어도 하나의 $\tau_{i}$는 0보다 작다 검정통계량으로 $\tau_{i}$가 0보다 작은 지 알 수 없다
적어도 하나의 $\tau_{i}$는 0이 아니다 $H>\chi_{k-1\ ;\ \alpha}^{2}$

M60-29 순위합검정 통계모형 Wilcoxon rank-sum Model

순위합검정 통계모형 Wilcoxon rank-sum Model

$$X_{ij}=\mu+\tau_i+\beta_j+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots ,n$$

 

가설검정

 

귀무가설

 

$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$

 

대립가설

 

$H_1$ : 적어도 하나의 $\tau_i$는 $0$이 아니다

 

각 수준별 순위 데이터에 대한 기호

치리
블록
수준 1 수준 2 $\cdots$ 수준 $k$  
1 $R_{11}$ $R_{21}$ $\cdots$ $R_{k1}$
2 $R_{12}$ $R_{22}$ $R_{k2}$
$\cdots$ $\cdots$ $\cdots$ $\cdots$
$n$ $R_{1n}$ $R_{2n}$ $R_{kn}$
순위합 $R_{1\cdot}$ $R_{2\cdot}$ $\cdots$ $R_{k\cdot}$
평균순위 ${\bar R}_{1\cdot}$ ${\bar R}_{2\cdot}$ $\cdots$ ${\bar R}_{k\cdot}$ 총평균
$\bar R_{\cdot\cdot}=\dfrac{(k+1)}{2}$

 

$$SS_{Tr}=\sum_{i=1}^{k}n(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$

 

$$SS_T=SS_{Tr}+SS_E$$

 

$$\eqalign{F&=\dfrac{MS_{Tr}}{MS_E}\cr&=c\dfrac{SS_{Tr}}{{SS_T-SS{Tr}-SS_E}}}$$

 

$$\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$$

M60-30 비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test

비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test

 

비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정표 Friedman test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$ $\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$ 적어도 하나의 $\tau_{i}$는 크다 검정통계량으로 $\tau_{i}$가 큰지 알 수 없다
적어도 하나의 $\tau_{i}$는 작다 검정통계량으로 $\tau_{i}$가 작은지 알 수 없다
적어도 하나의 $\tau_{i}$는 다르다 $S>s{\left({k,\ n}\right)}_{\alpha}$

M60-31 비모수 원인 1개 및 블럭화변수 1개 - 표본크기가 큰 경우 : 프리드만검정 Friedman test

비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정 Friedman test

$$S’=\dfrac{S}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{np(p^2-1)}}$$

 

여기서,  $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$

 

$X$ ${x}_{1}{,}\hspace{0.33em}{x}_{2}{,}\cdots{,}\hspace{0.33em}{x}_{k}$ 합계
${P}\left({{X}{=}{x}}\right)$ ${p}_{1}{,}\hspace{0.33em}{p}_{2}{,}\cdots{,}\hspace{0.33em}{p}_{k}$ 1

 

 

비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정표 Friedman test table

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$ $\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$ 적어도 하나의 $\tau_{i}$는 크다 검정통계량으로 $\tau_{i}$가 큰 지 알 수 없다
적어도 하나의 $\tau_{i}$는 작다 검정통계량으로 $\tau_{i}$가 작은 지 알 수 없다
적어도 하나의 $\tau_{i}$는 다르다 $S>\chi_{k-1\ ;\ \alpha}^{2}$

M60-32 두 범주형 변수의 r X c 교차표 관측빈도수

두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$)

두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$) 기호표

관측빈도수

$O_{ij}$

범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$

범주형

변수 $A$

$A_{1}$

$O_{11}$

$O_{12}$

$\cdots$

$O_{1c}$

$T_{1\cdot}$

$A_{2}$

$O_{21}$

$O_{22}$

$\cdots$

$O_{2c}$

$T_{2\cdot}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$O_{r1}$

$O_{r2}$

$\cdots$

$O_{rc}$

$T_{r\cdot}$

열의 합 $T_{\cdot 1}$ $T_{\cdot 2}$ $\cdots$ $T_{\cdot c}$ $n$

M60-33 두 범주형 변수의 r X c 교차표 기대빈도수

두 범주형 변수의 교차표 기대빈도수

두 범주형 변수의 교차표 관찰빈도수의 주변확률분포(marginal probability distribution)로 기대빈도수 산출

 

$$E_{ij}=n\left(\dfrac{T_{i·}}{n}\right)\left(\dfrac{T_{·j}}{n}\right)=T_{i·}\left(\dfrac{T_{·j}}{n}\right)$$

 

두 범주형 변수의 교차표 기대빈도수 기호표

기대빈도수
$E_{ij}$
범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$

범주형

변수 $A$

$A_{1}$

$E_{11}=T_{1\cdot}{{T_{\cdot 1}}\over{n}}$

$E_{12}=T_{1\cdot}{{T_{\cdot 2}}\over{n}}$

$\cdots$

$E_{1c}=T_{1\cdot}{{T_{\cdot c}}\over{n}}$

$T_{1\cdot}$

$A_{2}$

$E_{21}=T_{2\cdot}{{T_{\cdot 1}}\over{n}}$

$E_{22}=T_{2\cdot}{{T_{\cdot 2}}\over{n}}$

$\cdots$

$E_{2c}=T_{2\cdot}{{T_{\cdot c}}\over{n}}$

$T_{2\cdot}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$E_{r1}=T_{r\cdot}{{T_{\cdot 1}}\over{n}}$

$E_{r2}=T_{r\cdot}{{T_{\cdot 2}}\over{n}}$

$\cdots$

$E_{rc}=T_{r\cdot}{{T_{\cdot c}}\over{n}}$

$T_{r\cdot}$

열의 합 $T_{\cdot 1}$ $T_{\cdot 2}$ $\cdots$ $T_{\cdot c}$ $n$

M60-35 두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정

두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정

검정통계량

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$

귀무가설($H_0$) 기각역

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}\gt\chi_{(r-1)(c-1);\alpha}^2$$

 

두 범주형 변수의 $r\times c$ 교차표 관측빈도수와 기대빈도수의 차이로 생성한 확률변수($Z^2$) 기호표

$Z^2$ 범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$

범주형

변수 $A$

$A_{1}$

$\dfrac{(O_{11}-E_{11})^2}{E_{11}}$

$\dfrac{(O_{12}-E_{12})^2}{E_{12}}$

$\cdots$

$\dfrac{(O_{1c}-E_{1c})^2}{E_{1c}}$

$$\sum_{j=1}^{c}\dfrac{(O_{1j}-E_{1j})^2}{E_{1j}}$$

$A_{2}$

$\dfrac{(O_{21}-E_{21})^2}{E_{21}}$

$\dfrac{(O_{22}-E_{22})^2}{E_{22}}$

$\cdots$

$\dfrac{(O_{2c}-E_{2c})^2}{E_{2c}}$

$$\sum_{j=1}^{c}\dfrac{(O_{2j}-E_{2j})^2}{E_{2j}}$$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$\dfrac{(O_{r1}-E_{r1})^2}{E_{r1}}$

$\dfrac{(O_{r2}-E_{r2})^2}{E_{r2}}$

$\cdots$

$\dfrac{(O_{rc}-E_{rc})^2}{E_{rc}}$

$$\sum_{j=1}^{c}\dfrac{(O_{rj}-E_{rj})^2}{E_{rj}}$$

열의 합 $$\sum_{i=1}^{r}\dfrac{(O_{i1}-E_{i1})^2}{E_{i1}}$$ $$\sum_{i=1}^{r}\dfrac{(O_{i2}-E_{i2})^2}{E_{i2}}$$ $\cdots$ $$\sum_{i=1}^{r}\dfrac{(O_{ic}-E_{ic})^2}{E_{ic}}$$ $$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$

두 범주형 확률변수의 동일성 : 교차분석 피어슨카이제곱검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\chi_{obs}^2=0$ $\chi_{obs}^2=\sum\limits_{i=1}^{r}\sum\limits_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$ $\chi_{obs}^2<0$ 검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다.
$\chi_{obs}^2>0$ 검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다.
$\chi_{obs}^2\neq0$ $\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$

M60-34 한 범주형 변수의 확률분포표 확률 기호

한 범주형 변수의 확률분포표 확률 기호

한 범주형 변수의 확률분포표 확률 기호

확률

$P_k$

범주형 변수 $X$
${X}_{1}$ ${X}_{2}$ $\cdots$ ${X}_{k}$
${P}_{1}$ ${P}_{2}$ $\cdots$ ${P}_{k}$ 1

M60-36 두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정

두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정

검정통계량

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$

귀무가설($H_0$) 기각역

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}\gt\chi_{(r-1)(c-1);\alpha}^2$$

 

두 범주형 변수의 $r\times c$ 교차표 관측확률 기호표

관측확률

$P_{rc}$

범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$
범주형 변수 $A$

$A_{1}$

$P_{11}$

$P_{12}$

$\cdots$

$P_{1c}$

$P_{1\cdot}$

$A_{2}$

$P_{21}$

$P_{22}$

$\cdots$

$P_{2c}$

$P_{2\cdot}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$P_{r1}$

$P_{r2}$

$\cdots$

$P_{rc}$

$P_{r\cdot}$

열의 합 $P_{\cdot 1}$ $P_{\cdot 2}$ $\cdots$ $P_{\cdot c}$ 1

두 범주형 변수의 $r\times c$ 교차표 기대확률 기호표

기대확률

$P_{rc}$

범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$
범주형 변수 $A$

$A_{1}$

$P_{1\cdot}P_{\cdot 1}$

$P_{1\cdot}P_{\cdot 2}$

$\cdots$

$P_{1\cdot}P_{\cdot c}$

$P_{1\cdot}$

$A_{2}$

$P_{2\cdot}P_{\cdot 1}$

$P_{2\cdot}P_{\cdot 2}$

$\cdots$

$P_{2\cdot}P_{\cdot c}$

$P_{2\cdot}$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$P_{r\cdot}P_{\cdot 1}$

$P_{r\cdot}P_{\cdot 2}$

$\cdots$

$P_{r\cdot}P_{\cdot c}$

$P_{r\cdot}$

열의 합 $P_{\cdot 1}$ $P_{\cdot 2}$ $\cdots$ $P_{\cdot c}$ 1

두 범주형 변수의 $r\times c$ 교차표 관측확률과 기대확률의 편차로 생성한 새로운 확률변수($Z^2$) 기호표

$Z^2$ 범주형 변수 $B$ 행의 합
$B_{1}$ $B_{2}$ $\cdots$ $B_{c}$

범주형

변수 $A$

$A_{1}$

$\dfrac{(P_{11}-P_{1\cdot}P_{\cdot 1})^2}{P_{1\cdot}P_{\cdot 1}}$

$\dfrac{(P_{12}-P_{1\cdot}P_{\cdot 2})^2}{P_{1\cdot}P_{\cdot 2}}$

$\cdots$

$\dfrac{(P_{1c}-P_{1\cdot}P_{\cdot c})^2}{P_{1\cdot}P_{\cdot c}}$

$$\sum_{j=1}^{c}\dfrac{(P_{1j}-P_{1\cdot}P_{\cdot j})^2}{P_{1\cdot}P_{\cdot j}}$$

$A_{2}$

$\dfrac{(P_{21}-P_{2\cdot}P_{\cdot 1})^2}{P_{2\cdot}P_{\cdot 1}}$

$\dfrac{(P_{22}-P_{2\cdot}P_{\cdot 2})^2}{P_{2\cdot}P_{\cdot 2}}$

$\cdots$

$\dfrac{(P_{2c}-P_{2\cdot}P_{\cdot c})^2}{P_{2\cdot}P_{\cdot c}}$

$$\sum_{j=1}^{c}\dfrac{(P_{2j}-P_{2\cdot}P_{\cdot j})^2}{P_{2\cdot}P_{\cdot j}}$$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$\cdots$

$A_{r}$

$\dfrac{(P_{r1}-P_{r\cdot}P_{\cdot 1})^2}{P_{r\cdot}P_{\cdot 1}}$

$\dfrac{(P_{r2}-P_{r\cdot}P_{\cdot 2})^2}{P_{r\cdot}P_{\cdot 2}}$

$\cdots$

$\dfrac{(P_{rc}-P_{r\cdot}P_{\cdot c})^2}{P_{r\cdot}P_{\cdot c}}$

$$\sum_{j=1}^{c}\dfrac{(P_{rj}-P_{r\cdot}P_{\cdot j})^2}{P_{r\cdot}P_{\cdot j}}$$

열의 합 $$\sum_{i=1}^{r}\dfrac{(P_{i1}-P_{i\cdot}P_{\cdot 1})^2}{P_{i\cdot}P_{\cdot 1}}$$ $$\sum_{i=1}^{r}\dfrac{(P_{i2}-P_{i\cdot}P_{\cdot 2})^2}{P_{i\cdot}P_{\cdot 2}}$$ $\cdots$ $$\sum_{i=1}^{r}\dfrac{(P_{ic}-P_{i\cdot}P_{\cdot c})^2}{P_{i\cdot}P_{\cdot c}}$$ $$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$

두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정표

귀무가설($H_0$) 검정통계량의 값 대립가설($H_1$) 귀무가설 기각역
$\chi_{obs}^2=0$ $$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$ $\chi_{obs}^2<0$ 검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다.
$\chi_{obs}^2>0$ 검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다.
$\chi_{obs}^2\neq0$ $\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$