M60 – Data Science

M10

M20

M30

M40

M50

M60

M70

M80

M100

M60-01 대응된 두 집단의 모평균 비교 - 등분산가정 : 대응표본 t검정

대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 $t$검정

새로운 확률변수

$D = X_2 – X_1 $

여기서, 확률변수 $X_2$와 $X_1$의 확률변수값은 대응됨

새로운 확률변수의 표본집합의 원소

$d_i = x_{i2} – x_{i1}$

여기서, $i$는 1부터 표본크기 $n$까지를 나타내는 양의 정수

새로운 확률변수($D$)의 평균($\mu_D$)

$\mu_{D} = \mu_{X_2} – \mu_{X_1}$

여기서, $\mu_{X_1}$, $\mu_{X_2}$는 두 집단의 모평균

새로운 확률변수($D$)의 분산

$\sigma_D^2=\mathrm Var(D)=\mathrm Var({d_i})$

새로운 확률변수의 표본평균($\bar D$)의 기대값, ${\rm E}(\bar D)$

$\bar D = {\bar X}_2 – {\bar X}_1$

여기서, $\bar X_1$, $\bar X_2$는 집단의 표본평균

확률변수($\bar D$)의 기대값은 두 집단의 모평균의 차이

${\rm E}(\bar D) = \mu_{\bar D} = \mu_{D} = \mu_{X_2} – \mu_{X_1}$

여기서, ∼ 는 점추정(point estimation)

$\mu_{D}$ 는 새로운 확률변수의 모평균

$\mu_{X_1}$, $\mu_{X_2}$는 집단의 모평균

표본평균 표집의 모분산

${\rm Var}(\bar {D}) = {\rm Var}(\overline {d_i}) = \dfrac{\sigma_{D}^2}{n}$

여기서, ∼ 는 점추정(point estimation)

$\sigma_{D}^2$ 새로운 확률변수의 모분산

대응표본( $d_i$)의 평균($\bar D$ or $\overline {d_i}$)

$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$

여기서, $n$은 표본크기

확률변수($D$)의 표본평균($\bar D$)의 분산, ${\rm Var}(\bar {D})$

$\mathrm Var(\bar {D}) = \mathrm Var(\overline {d_i}) = \dfrac{\sigma_{D}^2}{n}$

여기서, $n$은 표본크기

대응표본모분산의 점추정량인 대응표본분산(${S_D}^2$)의 계산값

$S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$

여기서, $n-1$은 자유도

대응표본평균의 표준오차(Standard Error of Mean)

${\rm SE}(\bar D)=\sqrt{{\rm Var}(\bar D)}= \sigma_{\bar D} = \sqrt{\dfrac{\sigma_D^2}{n}}∼\sqrt{\dfrac{S_D^2}{n}}=\dfrac{S_D}{\sqrt{n}}$

여기서, $S_{D}^2 = \dfrac{\sum\limits_{i=1}^n {(d_{i}-\overline {d_i})^2}}{n-1}$

검정통계량

$t = \dfrac{(\bar X_2 – \bar X_1)-D_0}{\dfrac{S_D}{\sqrt{n}}}= \dfrac{\bar D -D_0}{\dfrac{S_D}{\sqrt{n}}}$

여기서, $D_0$는 귀무가설에서 제시된 두 모평균의 차이

대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 t검정표

귀무가설$(H_0)$	검정통계량의 값	대립가설$(H_1)$	귀무가설 기각역
$$\mu_1-\mu_2=D_0$$	$$t=\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}$$	$$\mu_1-\mu_2\gt D_0$$	$$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\gt t_{n-1\ ;\ \alpha}$$
		$$\ \mu_1-\mu_2\lt D_0$$	$$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\lt-t_{n-1\ ;\ \alpha}$$
		$$\ \mu_1-\mu_2\ne D_0$$	$$\left\|\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\right\|\gt t_{n-1\ ;\ \frac{\alpha}{2}}$$

M60-02 대응비교를 위한 표본데이터와 표본통계량

대응비교를 위한 데이터와 통계량

대응비교를 위한 표본데이터와 통계량

집단 1의 표본데이터($x_{i1}$)

집단 2의 표본데이터($x_{i2}$)

통계량(대응 표본데이터 차이)

($d_{i}=x_{i1}-x_{i2}$)

$x_{11}$

$x_{21}$

$\cdots$

$x_{n1}$

$x_{12}$

$x_{22}$

$\cdots$

$x_{n2}$

$d_{1}=x_{11}-x_{12}$

$d_{2}=x_{21}-x_{22}$

$\cdots$

$d_{n}=x_{n1}-x_{n2}$

대응비교 통계량

$d_{i}$의 평균

$d_{i}$의 분산

$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$

$S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$

M60-03 독립된 두 집단의 모평균 비교 - 등분산가정 : 독립표본 t검정

독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정

두 모평균의 차이 $D_{0}$

검정통계량

$$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$

여기서, $D_0$는 귀무가설에서 제시된 두 모평균의 차이

$S_p^2$는 통합표본분산(pooled variation) : $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$

독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\mu_2 – \mu_1=D_0$	$$t=\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$ 여기서, $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$	$\mu_2 – \mu_1 > D_0$	$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}<-t_{n-2\ ;\ \alpha}$
		$\mu_2 – \mu_1 < D_0$	$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}>-t_{n-2\ ;\ \alpha}$
		$\mu_2 – \mu_1 \ne D_0$	$\left\|\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}\right\|>-t_{n-2\ ;\ \frac{\alpha}{2}}$

M60-04 독립된 두 집단의 모평균 비교 - 등분산이 아닌 경우 : 웰치 t검정

독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정

검정통계량

$$\dfrac{\bar{X}_1-\bar{X}_2}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$

자유도

$$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$

독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$$\mu_1-\mu_2=D_0$$	$$t=\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$ 여기서, $$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$	$$\mu_1-\mu_2\gt D_0$$	$$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\gt t_{\nu \ ;\ \alpha}$$
		$$\mu_1-\mu_2\lt D_0$$	$$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\lt t_{\nu \ ;\ \alpha}$$
		$$\mu_1-\mu_2\ne D_0$$	$$\left\|\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\right\|\gt t_{\nu \ ;\ \frac{\alpha}{2}}$$

M60-05 독립된 두 집단의 모분산 비교 - 정규분포가정 : 독립표본 F검정

독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 $F$검정

$$F=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$

$$F_{(n_1-1), (n_2-1)}=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$

여기서, $n_1$과 $n_2$은 표본의 크기

$F_{(n_1-1), (n_2-1)}$는 두 모수 $(n_1-1), (n_2-1)$를 가지는 $F$확률분포

$S_1^2$, $S_2^2$는 두 표본분산

$\sigma_1^2$, $\sigma_2^2$는 두 모분산

검정통계량

$$F = \dfrac{S_1^2}{S_2^2}$$

귀무가설

$H_{0}\ :\ \sigma_{1}^{2}=\sigma_{2}^{2}$

독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 F검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$$\sigma_1^2=\sigma_2^2$$	$$F=\dfrac{S_1^2}{S_2^2}$$	$$\sigma_1^2\gt\sigma_2^2$$	$$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
		$$\sigma_1^2\lt\sigma_2^2$$	$$\dfrac{S_1^2}{S_2^2}\lt\ F_{n_1-1,\ n_2-1\ ;\ \alpha}$$
		$$\sigma_1^2\ne\sigma_2^2$$	$$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;1-\frac{\alpha}{2}}$$ $$\dfrac{S_1^2}{S_2^2}\lt F_{n_1-1,\ n_2-1\ ;\ \frac{\alpha} {2}}$$

M60-06 독립된 두 집단의 모비율 비교 - 표본크기가 큰 경우 : Z검정

독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정

표준오차

$$\dfrac{\hat{p}_1-\hat{p}_2}{\sigma_{\hat{p}_1-\hat{p}_2}}$$

여기서, $\sigma_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{p_1(1-p_1)+p_2(1-p_2)+2{p_1}{p_2}}{n}}∼\hat{p}_1-\hat{p}_2$

만일, $n_1 = n_2$이면

$$S_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{2\bar{p}}{n}}$$

여기서, $\bar{p}=\dfrac{(\hat{p}_1+\hat{p}_2)}{2}$

검정통계량

$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$

여기서, $\bar{p}=\dfrac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}$

독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$$ p_1=p_2$$	$$Z=\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$	$$p_1\gt p_2$$	$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\gt z_{\alpha}$$
		$$p_1\lt p_2$$	$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\lt -z_{\alpha}$$
		$$p_1\ne p_2$$	$$\left\|\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\right\|\gt z_{\frac{\alpha}{2}}$$

M60-07 일원분산분석의 데이터구조와 기호

일원분산분석의 데이터구조와 기호

일원분산분석 데이터(One-way ANOVA data)

원인으로 구분	모평균	모분산	표본크기	표본 관측값	표본평균	표본분산
집단 1	$\mu_{Y_1}$	$\sigma_{Y_1}^2$	$n_1$	$\begin{array}{cccc}{{y}_{11}}&{{y}_{12}}&{\cdots}&{{y}_{1{n}_{1}}}\end{array}$	${\bar{Y}}_{{1}\cdot}$	$S_{Y_1}^2$
집단 2	$\mu_{Y_2}$	$\sigma_{Y_2}^2$	$n_2$	$\begin{array}{cccc}{{y}_{21}}&{{y}_{22}}&{\cdots}&{{y}_{2{n}_{2}}}\end{array}$	${\bar{Y}}_{{2}\cdot}$	$S_{Y_2}^2$
. . .	. . .	. . .	. . .	. . .	. . .	. . .
집단 $k$	$\mu_{Y_k}$	$\sigma_{Y_k}^2$	$n_k$	$\begin{array}{cccc}{{y}_{k1}}&{{y}_{k2}}&{\cdots}&{{y}_{k{n}_{k}}}\end{array}$	${\bar{Y}}_{{k}\cdot}$	$S_{Y_k}^2$

원인으로 구분된 집단	관측값	평균
집단 1	$\begin{array}{cccc}{{Y}_{11}}&{{Y}_{12}}&{\cdots}&{{Y}_{1{n}_{1}}}\end{array}$	${\bar{Y}}_{{1}\cdot}$
집단 2	$\begin{array}{cccc}{{Y}_{21}}&{{Y}_{22}}&{\cdots}&{{Y}_{2{n}_{1}}}\end{array}$	${\bar{Y}}_{{2}\cdot}$
수준 $k$	$\begin{array}{cccc}{{Y}_{k1}}&{{Y}_{k2}}&{\cdots}&{{Y}_{k{n}_{1}}}\end{array}$	${\bar{Y}}_{{k}\cdot}$

M60-08 일원분산분석 통계모형

일원분산분석 통계모형

$$\eqalign{Y_{ij}&=\mu_i + \varepsilon_{ij}\cr&=\mu +\alpha_i +\varepsilon_{ij}}$$

여기서, $i=1,2,\cdots ,k$

$j=1,2,\cdots ,n_i$

M60-09 일원분산분석표

일원분산분석표

$$SS_T=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$

$$SS_{Tr}=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2$$

$$SS_E=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$

$$F_0=\dfrac{MS_{Tr}}{MS_E}=\dfrac{\dfrac{SS_{Tr}}{(k-1)}}{\dfrac{SS_E}{(n-k)}}$$

일원분산분석표

요인 (factor)	제곱합 (squared sum)	자유도 (degrees of freedom)	제곱평균 (mean squared)	$F$검정통계량 (F statistic)
처리 (Between)	$SS_{Tr}$	$k-1$	${MS}_{Tr}=\dfrac{SS_{Tr}}{k-1}$	$F_{0}=\dfrac{MS_{Tr}}{MS_E}$
오차 (Within)	$SS_E$	$n-k$	$MS_E=\dfrac{SS_E}{n-k}$
총 (Total)	$SS_T$	$n-1$	$MS_T=\dfrac{SS_T}{n-1}$

M60-10 일원분산분석 F검정

일원분산분석 F검정

귀무가설

$$H_0 :\alpha_1=\alpha_2=\cdots=\alpha_k=0$$

대립가설

$H_1$ : 적어도 한 $\alpha_k$는 $0$이 아니다.

검정통계량

$$F_0=\dfrac{MS_{Tr}}{MS_E}$$

기각역

$$F_0>F_{k-1,n-k;\alpha}$$

사후검정

$$HSD_{ij}=q_{k,n-k;\alpha}\cdot\sqrt{\frac{1}{2}(\frac{1}{n_i}+\frac{1}{n_j})MS_{E}}$$

일원분산분석 F검정표

귀무가설$(H_0)$	검정통계량의 값	대립가설$(H_1)$	귀무가설 기각역
$\alpha_1=\alpha_2=\cdots=\alpha_k=0$	$F_0=\dfrac{MS_{Tr}}{MS_E}$	적어도 한 $\alpha_k$는 $0$보다 크다.	검정통계량으로 $\alpha_k$가 0보다 큰지 알 수 없다.
		적어도 한 $\alpha_k$는 $0$보다 작다.	검정통계량으로 $\alpha_k$가 0보다 작은지 알 수 없다.
		적어도 한 $\alpha_k$는 $0$이 아니다.	$F_0>F_{k-1,n-k;\alpha}$

M60-11 이원분산분석 통계모형

이원분산분석 통계모형

$$Y_{ijk}=\mu +\alpha_i +\beta_j +\gamma_{ij}+\epsilon_{ijk}$$

여기서, $i=1,2,\cdots,a$

$j=1,2,\cdots,b$

$k=1,2,\cdots,r$

$\mu$ : 총평균
$\alpha_{i}$은 $A$의 $i$번째 수준의 효과
$\beta_{j}$은 $B$의 $j$번째 수준의 효과
$\gamma_{ij}$은 $A$의 $i$번째 수준과 $B$의 $j$번째 수준과의 교호작용효과
$\epsilon_{ijk}$은 오차항으로 서로 독립, $N(0,\sigma^2)$을 따름

총제곱합($SS_T$) : 자유도는 $n-1$

$$SS_T=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{\ldots})^2$$

인자 A의 처리제곱합($SS_A$) : 자유도는 $a-1$

$$SS_A=br\sum_{i=1}^{a}(\bar{Y}_{i..}-\bar{Y}_{\ldots})^2$$

인자 B의 처리제곱합($SS_A$) : 자유도는 $b-1$

$$SS_B=ar\sum_{j=1}^{b}(\bar{Y}_{.j.}-\bar{Y}_{\ldots})^2$$

인자 A와 B의 교호작용효과를 나타내는제곱합($SS_{AB}$) : 자유도는 $(a-1)(b-1)$

$$SS_{AB}=r\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{Y}_{ij.}-\bar{Y}_{i..}-\bar{Y}_{.j.}+\bar{Y}_{\ldots})^2$$

오차제곱합($SS_E$) : 자유도는 $n-ab$

$$SS_E=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{ij.})^2$$

M60-12 이원분산분석의 제곱합과 자유도 분할

이원분산분석의 제곱합과 자유도 분할

제곱합과 자유도의 분할

제곱합

$$SS_T=SS_A+SS_B+SS_{AB}+SS_E$$

자유도

$$n-1=(a-1)+(b-1)+(a-1)(b-1)+(n-ab)$$

M60-13 이원분산분석표

이원분산분석표

요인 (factor)	제곱합 (squared sum)	자유도 (degrees of freedom)	제곱평균 (mean squared)	$F$검정통계량 (F statistic)
요인$A$ (factor A)	$SS_A$	$a-1$	${MS_A}=\dfrac{SS_A}{a-1}$	$F_{1}=\dfrac{MS_A}{MS_E}$
요인$B$ (factor B)	$SS_B$	$b-1$	${MS_B}=\dfrac{SS_B}{b-1}$	$F_{2}=\dfrac{MS_B}{MS_E}$
요인$A$와 요인$B$의 상호작용 (interaction effect of A, B)	$SS_{AB}$	$(a-1)(b-1)$	${MS_{AB}}=\dfrac{SS_{AB}}{(a-1)(b-1)}$	$F_{3}=\dfrac{MS_{AB}}{MS_E}$
오차 (error)	$SS_E$	$n-ab$	${MS_E}=\dfrac{SS_E}{n-ab}$
전체 (total)	$SS_T$	$n-1$

M60-14 상호작용(교호작용)효과에 대한 F검정

상호작용(교호작용)효과에 대한 F검정

귀무가설

$$H_0:\gamma_{ij}=0$$

여기서, $i=1,2,\cdots,a$

$j=1,2,\cdots,b$

기각역

$$F_3=\dfrac{MS_{AB}}{MS_E}\gt F_{(a-1)(b-1),n-ab;\alpha}$$

상호작용(교호작용)효과에 대한 F검정표

귀무가설$(H_0)$	검정통계량의 값	대립가설$(H_1)$	귀무가설 기각역
$\gamma_{ij}=0$	$F_3=\dfrac{MS_{AB}}{MS_E}$	$\gamma_{ij} > 0$	검정통계량으로 $\gamma_{ij}$가 0보다 큰 지 알 수 없다.
		$\gamma_{ij} < 0$	검정통계량으로 $\gamma_{ij}$가 0보다 작은 지 알 수 없다.
		$\gamma_{ij}\neq0$	$F_3\gt F_{(a-1)(b-1),n-ab;\alpha}$

M60-15 원인 A의 주효과에 대한 F검정

원인 A의 주효과에 대한 F검정

귀무가설

$$H_0:\alpha_1=\alpha_2=\cdots=\alpha_a=0$$

기각역

$$F_1=\dfrac{MS_A}{MS_E}\gt F_{a-1,n-ab;\alpha}$$

원인 A의 주효과에 대한 F검정표

귀무가설$(H_0)$	검정통계량의 값	대립가설$(H_1)$	귀무가설 기각역
$\alpha_1=\alpha_2=\cdots=\alpha_a=0$	$F_1=\dfrac{MS_A}{MS_E}$	적어도 한 $\alpha_a$는 0보다 크다.	검정통계량으로 $\alpha_a$가 0보다 큰 지 알 수 없다.
		적어도 한 $\alpha_a$는 0보다 작다.	검정통계량으로 $\alpha_a$가 0보다 작은 지 알 수 없다.
		적어도 한 $\alpha_a$는 0이 아니다.	$F_1\gt F_{a-1,n-ab;\alpha}$

M60-16 원인 B의 주효과에 대한 F검정

원인 B의 주효과에 대한 F검정

귀무가설

$$H_0:\beta_1=\beta_2=\cdots=\beta_b=0$$

기각역

$$F_2=\dfrac{MS_B}{MS_E}\gt F_{b-1,n-ab;\alpha}$$

원인 B의 주효과에 대한 F검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\beta_1=\beta_2=\cdots=\beta_b=0$	$F_2=\dfrac{MS_B}{MS_E}$	적어도 한 $\beta_b$는 $0$보다 크다.	검정통계량으로 $\beta_b$가 $0$보다 큰 지 알 수 없다.
		적어도 한 $\beta_b$는 $0$보다 작다.	검정통계량으로 $\beta_b$가 $0$보다 작은 지 알 수 없다.
		적어도 한 $\beta_b$는 $0$이 아니다.	$F_2\gt F_{b-1,n-ab;\alpha}$

M60-17 중앙값의 부호검정 : Spearman rank test

중앙값의 부호검정 : Spearman rank test

중앙값의 부호검정표

귀무가설$(H_0)$	검정통계량의 값	대립가설$(H_1)$	귀무가설 기각역
$M=M_0$	$n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$	$M> M_0$	$n_{+}> B{\left({n,0.5}\right)}_{\alpha}$
		$M< M_0$	$n_{+}< B{\left({n,0.5}\right)}_{1-\alpha}$
		$M\ne M_0$	$n_{+}< B{\left({n,0.5}\right)}_{1-\frac{\alpha}{2}}$ 또는 $n_{+}> B{\left({n,0.5}\right)}_{\frac{\alpha}{2}}$

M60-18 중앙값의 부호검정 - 표본크기가 큰 경우

중앙값의 부호검정 – 표본크기가 큰 경우

만약 관측값 중에 $M_0$와 동일한 값이 있으면 그 관측값은 검정에서 사용하지 않는다. 즉, $n$을 감소시킨다.

중앙값의 부호검정표 – 표본크기가 큰 경우

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$M=M_0$	$n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$	$M> M_0$	$\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}> z_{\alpha}$
		$M< M_0$	$\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}<-z_{\alpha}$
		$M\ne M_0$	$\left\|\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}\right\|> z_{\frac{\alpha}{2}}$

M60-19 부호순위검정 통계모형

부호순위합검정 통계모형

$$X_i=M_0+\varepsilon_i$$

여기서, $i=1,2,\cdots ,n$

M60-20 중앙값의 부호순위검정 : Wicoxon Signed rank test

중앙값의 부호순위검정 : Wilcoxon Signed rank test

$$\mathrm{E}[R_+]=\dfrac{n(n+1)}{4}$$

$$\mathrm{Var}[R_+]=\dfrac{n(n+1)(2n+1)}{24}$$

중앙값의 부호순위합검정표 : Wilcoxon rank-sum test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$M=M_0$	$R_{+}=\left\|{x_{i}-M_{0}}\right\|$순위의 $+$부호 데이터의 순위합	$M> M_0$	$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$
		$M< M_0$	$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$
		$M\ne M_0$	$R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$

M60-21 중앙값의 부호순위검정 - 표본크기가 큰 경우 : Wicoxon Signed rank test

중앙값의 부호순위합검정 – 표본크기가 큰 경우 : Wilcoxon Signed rank test

순위			$R_{+}$의 가능한 순위
1	2	3	$R_{+}$의 가능한 순위
$-$	$-$	$-$	0
$+$	$-$	$-$	1
$-$	$+$	$-$	2
$-$	$-$	$+$	3
$+$	$+$	$-$	3
$+$	$-$	$+$	4
$-$	$+$	$+$	5
$+$	$+$	$+$	6

$R_{+}=x$	0	1	2	3	4	5	6
$P(R_{+}=x)$	${{1}\over{8}}$	${{1}\over{8}}$	${{1}\over{8}}$	${{2}\over{8}}$	${{1}\over{8}}$	${{1}\over{8}}$	${{1}\over{8}}$

$$\mathrm{Var}[R_+]=\dfrac{1}{24}\left[n(n+1)(2n+1)-\dfrac{1}{2}\sum\limits_{j=1}^{g}t_{j}(t_{j}-1)(t_{j}+1)\right]$$

여기서, $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

표본크기가 큰 경우 – 중앙값의 부호순위합검정(윌콕슨검정)표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$M=M_0$	$R_{+}=\left\|{x_{i}-M_{0}}\right\|$순위의 $+$부호 데이터의 순위합	$M> M_0$	$\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{>} z_{\alpha}$
		$M< M_0$	$\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{<}-z_{\alpha}$
		$M\ne M_0$	$\left\|\dfrac{R_+ -E(R_+)} {\sqrt{V(R_+)}}\right\|{>} z_{\frac{\alpha}{2}}$

M60-22 순위합검정 모형 : Wilcoxon rank-sum Model

순위합검정 모형 : Wilcoxon rank-sum Model

$$X_i=M_1+\varepsilon_i$$

여기서, $i=1,2,\cdots, n_1$

$$Y_j=M_1+\Delta+\varepsilon_j$$

여기서, $j=1,2,\cdots,n_2$

$M_2=M_1+\Delta$

M60-23 순위합검정 : Wilcoxon rank-sum test

순위합검정 : Wilcoxon rank-sum test

$$\mathrm{E}[R_2]=\dfrac{n_2(n_1+n_2+1)}{2}$$

$$V(R_2)=\dfrac{n_1 n_2(n_1+n_2+1)}{12}$$

순위합검정표 : Wilcoxon rank-sum test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$M_1=M_2$	$R_{2}=’Y{\rm 표본에}\ {\rm 부여한}\ {\rm 순위합}’$	$M_1> M_2$	$R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\alpha}$
		$M_1< M_2$	$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\alpha}$
		$M_1\ne M_2$	$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\frac{\alpha}{2}}$

M60-24 대응비교를 위한 데이터와 통계량

대응비교를 위한 데이터와 통계량

모집단 1의 표본($x_{i1}$)	모집단 2의 표본($x_{i2}$)	차이 $d_{i}=x_{i1}-x_{i2}$
$x_{11}$	$x_{12}$	$d_{1}=x_{11}-x_{12}$
$x_{21}$	$x_{22}$	$d_{2}=x_{21}-x_{22}$
$\cdots$	$\cdots$	$\cdots$
$x_{n1}$	$x_{n2}$	$d_{n}=x_{n1}-x_{n2}$

M60-25 대응표본 - 부호순위합검정 : Wilcoxon Signed rank test

대응표본 – 부호순위합검정 : Wilcoxon Signed rank test

대응표본 – 부호순위합검정 : Wilcoxon Signed rank test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$M_d=0$	$R_{+}=’\left\|{d_{i}}\right\|\ {\rm 순위에서}+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$	$M_d> 0$	$R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$
		$M_d< 0$	$R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$
		$M_d\ne 0$	$R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$

M60-26 각 수준별 확률표본에 대한 기호

각 수준별 확률표본에 대한 기호

수준 1	수준 2	$\cdots$	수준
$X_{11}$	$X_{21}$	$\cdots$	$X_{k1}$
$X_{12}$	$X_{22}$		$\cdots$
$\cdots$	$\cdots$		$X_{k2}$
$X_{1n_{1}}$	$X_{2n_{2}}$		$X_{kn_{k}}$
수준 1 평균	수준 2 평균	$\cdots$	수준 $k$평균	총평균
${\bar X}_{1\cdot}$	${\bar X}_{2\cdot}$	$\cdots$	${\bar X}_{k\cdot}$	${\bar X}_{\cdot\cdot}$

M60-27 비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

통계모형

$$X_{ij}=\mu+\tau_i+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots,n_i$$

여기서, $\sum\limits_{i=1}^{k}\tau_i=0$

검정

귀무가설

$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$

대립가설

$H_1$ : 적어도 하나의 $\tau_i$는 $0$이 아니다

각 수준별 순위 데이터에 대한 기호

수준 1	수준 2	$\cdots$	수준 $k$
$R_{11}$	$R_{21}$	$\cdots$	$R_{k1}$
$R_{12}$	$R_{22}$		$R_{k2}$
$\cdots$	$\cdots$		$\cdots$
$R_{1n_{1}}$	$R_{2n_{2}}$		$R_{kn_{k}}$
수준 1 합	수준 2 합	$\cdots$	수준 합
$R_{1\cdot}$	$R_{2\cdot}$	$\cdots$	$R_{k\cdot}$
수준 1 평균	수준 2 평균	$\cdots$	수준 평균	총평균
${\bar R}_{1\cdot}$	${\bar R}_{2\cdot}$	$\cdots$	${\bar R}_{k\cdot}$	${\bar R}_{\cdot\cdot}=\dfrac{(n+1)}{2}$

$$\eqalign{SS_T&=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(R_{ij}-\bar{R}_{\cdot\cdot})^2\cr&=\sum_{k=1}^{n}(k-\bar{R}_{\cdot\cdot})^2\cr&=n(n+1)(n-1)}$$

$$SS_{Tr}=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$

$$SS_T=SS_{Tr}+SS_E$$

$$\eqalign{F&=\dfrac{MS_{Tr}}{MSE}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SSE}{n-k}}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SS_T-SS_{Tr}}{n-k}}\cr&=\dfrac{\dfrac{n-k}{k-1}}{\dfrac{SS_T}{SS_{Tr}}-1}}$$

$$\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$$

비모수 분산분석 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_0$)	귀무가설 기각역
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$	$\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$	적어도 하나의 $\tau_i$는 0보다 크다	검정통계량으로 $\tau_i$가 0보다 큰 지 알 수 없다
		적어도 하나의 $\tau_i$는 0보다 작다	검정통계량으로 $\tau_i$가 0보다 작은 지 알 수 없다
		적어도 하나의 $\tau_i$는 0이 아니다	$H>h(n_{1},\ n_{2},\ \cdots ,\ n_{k})_{\alpha}$

M60-28 비모수 분산분석 - 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test

$$H’=\dfrac{H}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{n^3-n}}$$

여기서, $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$

비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$	$H$	적어도 하나의 $\tau_{i}$는 0보다 크다	검정통계량으로 $\tau_{i}$가 0보다 큰 지 알 수 없다
		적어도 하나의 $\tau_{i}$는 0보다 작다	검정통계량으로 $\tau_{i}$가 0보다 작은 지 알 수 없다
		적어도 하나의 $\tau_{i}$는 0이 아니다	$H>\chi_{k-1\ ;\ \alpha}^{2}$

M60-29 순위합검정 통계모형 Wilcoxon rank-sum Model

순위합검정 통계모형 Wilcoxon rank-sum Model

$$X_{ij}=\mu+\tau_i+\beta_j+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots ,n$$

가설검정

귀무가설

$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$

대립가설

$H_1$ : 적어도 하나의 $\tau_i$는 $0$이 아니다

각 수준별 순위 데이터에 대한 기호

치리 블록	수준 1	수준 2	$\cdots$	수준 $k$
1	$R_{11}$	$R_{21}$	$\cdots$	$R_{k1}$
2	$R_{12}$	$R_{22}$		$R_{k2}$
$\cdots$	$\cdots$	$\cdots$		$\cdots$
$n$	$R_{1n}$	$R_{2n}$		$R_{kn}$
순위합	$R_{1\cdot}$	$R_{2\cdot}$	$\cdots$	$R_{k\cdot}$
평균순위	${\bar R}_{1\cdot}$	${\bar R}_{2\cdot}$	$\cdots$	${\bar R}_{k\cdot}$	총평균 $\bar R_{\cdot\cdot}=\dfrac{(k+1)}{2}$

$$SS_{Tr}=\sum_{i=1}^{k}n(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$

$$SS_T=SS_{Tr}+SS_E$$

$$\eqalign{F&=\dfrac{MS_{Tr}}{MS_E}\cr&=c\dfrac{SS_{Tr}}{{SS_T-SS{Tr}-SS_E}}}$$

$$\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$$

M60-30 비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test

비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test

비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정표 Friedman test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$	$\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$	적어도 하나의 $\tau_{i}$는 크다	검정통계량으로 $\tau_{i}$가 큰지 알 수 없다
		적어도 하나의 $\tau_{i}$는 작다	검정통계량으로 $\tau_{i}$가 작은지 알 수 없다
		적어도 하나의 $\tau_{i}$는 다르다	$S>s{\left({k,\ n}\right)}_{\alpha}$

M60-31 비모수 원인 1개 및 블럭화변수 1개 - 표본크기가 큰 경우 : 프리드만검정 Friedman test

비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정 Friedman test

$$S’=\dfrac{S}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{np(p^2-1)}}$$

여기서, $g$는 동점집단의 수

$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)

$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$

$X$	${x}_{1}{,}\hspace{0.33em}{x}_{2}{,}\cdots{,}\hspace{0.33em}{x}_{k}$	합계
${P}\left({{X}{=}{x}}\right)$	${p}_{1}{,}\hspace{0.33em}{p}_{2}{,}\cdots{,}\hspace{0.33em}{p}_{k}$	1

비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정표 Friedman test table

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$	$\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$	적어도 하나의 $\tau_{i}$는 크다	검정통계량으로 $\tau_{i}$가 큰 지 알 수 없다
		적어도 하나의 $\tau_{i}$는 작다	검정통계량으로 $\tau_{i}$가 작은 지 알 수 없다
		적어도 하나의 $\tau_{i}$는 다르다	$S>\chi_{k-1\ ;\ \alpha}^{2}$

M60-32 두 범주형 변수의 r X c 교차표 관측빈도수

두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$)

두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$) 기호표

관측빈도수 $O_{ij}$		범주형 변수 $B$				행의 합
관측빈도수 $O_{ij}$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$O_{11}$	$O_{12}$	$\cdots$	$O_{1c}$	$T_{1\cdot}$
	$A_{2}$	$O_{21}$	$O_{22}$	$\cdots$	$O_{2c}$	$T_{2\cdot}$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$O_{r1}$	$O_{r2}$	$\cdots$	$O_{rc}$	$T_{r\cdot}$
열의 합		$T_{\cdot 1}$	$T_{\cdot 2}$	$\cdots$	$T_{\cdot c}$	$n$

M60-33 두 범주형 변수의 r X c 교차표 기대빈도수

두 범주형 변수의 교차표 기대빈도수

두 범주형 변수의 교차표 관찰빈도수의 주변확률분포(marginal probability distribution)로 기대빈도수 산출

$$E_{ij}=n\left(\dfrac{T_{i·}}{n}\right)\left(\dfrac{T_{·j}}{n}\right)=T_{i·}\left(\dfrac{T_{·j}}{n}\right)$$

두 범주형 변수의 교차표 기대빈도수 기호표

기대빈도수 $E_{ij}$		범주형 변수 $B$				행의 합
기대빈도수 $E_{ij}$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$E_{11}=T_{1\cdot}{{T_{\cdot 1}}\over{n}}$	$E_{12}=T_{1\cdot}{{T_{\cdot 2}}\over{n}}$	$\cdots$	$E_{1c}=T_{1\cdot}{{T_{\cdot c}}\over{n}}$	$T_{1\cdot}$
	$A_{2}$	$E_{21}=T_{2\cdot}{{T_{\cdot 1}}\over{n}}$	$E_{22}=T_{2\cdot}{{T_{\cdot 2}}\over{n}}$	$\cdots$	$E_{2c}=T_{2\cdot}{{T_{\cdot c}}\over{n}}$	$T_{2\cdot}$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$E_{r1}=T_{r\cdot}{{T_{\cdot 1}}\over{n}}$	$E_{r2}=T_{r\cdot}{{T_{\cdot 2}}\over{n}}$	$\cdots$	$E_{rc}=T_{r\cdot}{{T_{\cdot c}}\over{n}}$	$T_{r\cdot}$
열의 합		$T_{\cdot 1}$	$T_{\cdot 2}$	$\cdots$	$T_{\cdot c}$	$n$

M60-35 두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정

두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정

검정통계량

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$

귀무가설($H_0$) 기각역

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}\gt\chi_{(r-1)(c-1);\alpha}^2$$

두 범주형 변수의 $r\times c$ 교차표 관측빈도수와 기대빈도수의 차이로 생성한 확률변수($Z^2$) 기호표

$Z^2$		범주형 변수 $B$				행의 합
$Z^2$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$\dfrac{(O_{11}-E_{11})^2}{E_{11}}$	$\dfrac{(O_{12}-E_{12})^2}{E_{12}}$	$\cdots$	$\dfrac{(O_{1c}-E_{1c})^2}{E_{1c}}$	$$\sum_{j=1}^{c}\dfrac{(O_{1j}-E_{1j})^2}{E_{1j}}$$
	$A_{2}$	$\dfrac{(O_{21}-E_{21})^2}{E_{21}}$	$\dfrac{(O_{22}-E_{22})^2}{E_{22}}$	$\cdots$	$\dfrac{(O_{2c}-E_{2c})^2}{E_{2c}}$	$$\sum_{j=1}^{c}\dfrac{(O_{2j}-E_{2j})^2}{E_{2j}}$$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$\dfrac{(O_{r1}-E_{r1})^2}{E_{r1}}$	$\dfrac{(O_{r2}-E_{r2})^2}{E_{r2}}$	$\cdots$	$\dfrac{(O_{rc}-E_{rc})^2}{E_{rc}}$	$$\sum_{j=1}^{c}\dfrac{(O_{rj}-E_{rj})^2}{E_{rj}}$$
열의 합		$$\sum_{i=1}^{r}\dfrac{(O_{i1}-E_{i1})^2}{E_{i1}}$$	$$\sum_{i=1}^{r}\dfrac{(O_{i2}-E_{i2})^2}{E_{i2}}$$	$\cdots$	$$\sum_{i=1}^{r}\dfrac{(O_{ic}-E_{ic})^2}{E_{ic}}$$	$$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$

두 범주형 확률변수의 동일성 : 교차분석 피어슨카이제곱검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\chi_{obs}^2=0$	$\chi_{obs}^2=\sum\limits_{i=1}^{r}\sum\limits_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$	$\chi_{obs}^2<0$	검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다.
		$\chi_{obs}^2>0$	검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다.
		$\chi_{obs}^2\neq0$	$\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$

M60-34 한 범주형 변수의 확률분포표 확률 기호

한 범주형 변수의 확률분포표 확률 기호

확률

$P_k$

범주형 변수 $X$

합

${X}_{1}$

${X}_{2}$

$\cdots$

${X}_{k}$

${P}_{1}$

${P}_{2}$

$\cdots$

${P}_{k}$

M60-36 두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정

두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정

검정통계량

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$

귀무가설($H_0$) 기각역

$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}\gt\chi_{(r-1)(c-1);\alpha}^2$$

두 범주형 변수의 $r\times c$ 교차표 관측확률 기호표

관측확률 $P_{rc}$		범주형 변수 $B$				행의 합
관측확률 $P_{rc}$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$P_{11}$	$P_{12}$	$\cdots$	$P_{1c}$	$P_{1\cdot}$
	$A_{2}$	$P_{21}$	$P_{22}$	$\cdots$	$P_{2c}$	$P_{2\cdot}$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$P_{r1}$	$P_{r2}$	$\cdots$	$P_{rc}$	$P_{r\cdot}$
열의 합		$P_{\cdot 1}$	$P_{\cdot 2}$	$\cdots$	$P_{\cdot c}$	1

두 범주형 변수의 $r\times c$ 교차표 기대확률 기호표

기대확률 $P_{rc}$		범주형 변수 $B$				행의 합
기대확률 $P_{rc}$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$P_{1\cdot}P_{\cdot 1}$	$P_{1\cdot}P_{\cdot 2}$	$\cdots$	$P_{1\cdot}P_{\cdot c}$	$P_{1\cdot}$
	$A_{2}$	$P_{2\cdot}P_{\cdot 1}$	$P_{2\cdot}P_{\cdot 2}$	$\cdots$	$P_{2\cdot}P_{\cdot c}$	$P_{2\cdot}$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$P_{r\cdot}P_{\cdot 1}$	$P_{r\cdot}P_{\cdot 2}$	$\cdots$	$P_{r\cdot}P_{\cdot c}$	$P_{r\cdot}$
열의 합		$P_{\cdot 1}$	$P_{\cdot 2}$	$\cdots$	$P_{\cdot c}$	1

두 범주형 변수의 $r\times c$ 교차표 관측확률과 기대확률의 편차로 생성한 새로운 확률변수($Z^2$) 기호표

$Z^2$		범주형 변수 $B$				행의 합
$Z^2$		$B_{1}$	$B_{2}$	$\cdots$	$B_{c}$	행의 합
범주형 변수 $A$	$A_{1}$	$\dfrac{(P_{11}-P_{1\cdot}P_{\cdot 1})^2}{P_{1\cdot}P_{\cdot 1}}$	$\dfrac{(P_{12}-P_{1\cdot}P_{\cdot 2})^2}{P_{1\cdot}P_{\cdot 2}}$	$\cdots$	$\dfrac{(P_{1c}-P_{1\cdot}P_{\cdot c})^2}{P_{1\cdot}P_{\cdot c}}$	$$\sum_{j=1}^{c}\dfrac{(P_{1j}-P_{1\cdot}P_{\cdot j})^2}{P_{1\cdot}P_{\cdot j}}$$
	$A_{2}$	$\dfrac{(P_{21}-P_{2\cdot}P_{\cdot 1})^2}{P_{2\cdot}P_{\cdot 1}}$	$\dfrac{(P_{22}-P_{2\cdot}P_{\cdot 2})^2}{P_{2\cdot}P_{\cdot 2}}$	$\cdots$	$\dfrac{(P_{2c}-P_{2\cdot}P_{\cdot c})^2}{P_{2\cdot}P_{\cdot c}}$	$$\sum_{j=1}^{c}\dfrac{(P_{2j}-P_{2\cdot}P_{\cdot j})^2}{P_{2\cdot}P_{\cdot j}}$$
	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$	$\cdots$
	$A_{r}$	$\dfrac{(P_{r1}-P_{r\cdot}P_{\cdot 1})^2}{P_{r\cdot}P_{\cdot 1}}$	$\dfrac{(P_{r2}-P_{r\cdot}P_{\cdot 2})^2}{P_{r\cdot}P_{\cdot 2}}$	$\cdots$	$\dfrac{(P_{rc}-P_{r\cdot}P_{\cdot c})^2}{P_{r\cdot}P_{\cdot c}}$	$$\sum_{j=1}^{c}\dfrac{(P_{rj}-P_{r\cdot}P_{\cdot j})^2}{P_{r\cdot}P_{\cdot j}}$$
열의 합		$$\sum_{i=1}^{r}\dfrac{(P_{i1}-P_{i\cdot}P_{\cdot 1})^2}{P_{i\cdot}P_{\cdot 1}}$$	$$\sum_{i=1}^{r}\dfrac{(P_{i2}-P_{i\cdot}P_{\cdot 2})^2}{P_{i\cdot}P_{\cdot 2}}$$	$\cdots$	$$\sum_{i=1}^{r}\dfrac{(P_{ic}-P_{i\cdot}P_{\cdot c})^2}{P_{i\cdot}P_{\cdot c}}$$	$$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$

두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정표

귀무가설($H_0$)	검정통계량의 값	대립가설($H_1$)	귀무가설 기각역
$\chi_{obs}^2=0$	$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$	$\chi_{obs}^2<0$	검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다.
		$\chi_{obs}^2>0$	검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다.
		$\chi_{obs}^2\neq0$	$\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$