M60-01 대응된 두 집단의 모평균 비교 - 등분산가정 : 대응표본 t검정
대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 $t$검정
새로운 확률변수
$D = X_2 – X_1 $
여기서, 확률변수 $X_2$와 $X_1$의 확률변수값은 대응됨
새로운 확률변수의 표본집합의 원소
$d_i = x_{i2} – x_{i1}$
여기서, $i$는 1부터 표본크기 $n$까지를 나타내는 양의 정수
새로운 확률변수($D$)의 평균($\mu_D$)
$\mu_{D} = \mu_{X_2} – \mu_{X_1}$
여기서, $\mu_{X_1}$, $\mu_{X_2}$는 두 집단의 모평균
새로운 확률변수($D$)의 분산
$\sigma_D^2=\mathrm Var(D)=\mathrm Var({d_i})$
새로운 확률변수의 표본평균($\bar D$)의 기대값, ${\rm E}(\bar D)$
$\bar D = {\bar X}_2 – {\bar X}_1$
여기서, $\bar X_1$, $\bar X_2$는 집단의 표본평균
확률변수($\bar D$)의 기대값은 두 집단의 모평균의 차이
${\rm E}(\bar D) = \mu_{\bar D} = \mu_{D} = \mu_{X_2} – \mu_{X_1}$
여기서, ∼ 는 점추정(point estimation)
$\mu_{D}$ 는 새로운 확률변수의 모평균
$\mu_{X_1}$, $\mu_{X_2}$는 집단의 모평균
표본평균 표집의 모분산
${\rm Var}(\bar {D}) = {\rm Var}(\overline {d_i}) = \dfrac{\sigma_{D}^2}{n}$
여기서, ∼ 는 점추정(point estimation)
$\sigma_{D}^2$ 새로운 확률변수의 모분산
대응표본( $d_i$)의 평균($\bar D$ or $\overline {d_i}$)
$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$
여기서, $n$은 표본크기
확률변수($D$)의 표본평균($\bar D$)의 분산, ${\rm Var}(\bar {D})$
$\mathrm Var(\bar {D}) = \mathrm Var(\overline {d_i}) = \dfrac{\sigma_{D}^2}{n}$
여기서, $n$은 표본크기
대응표본모분산의 점추정량인 대응표본분산(${S_D}^2$)의 계산값
$S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$
여기서, $n-1$은 자유도
대응표본평균의 표준오차(Standard Error of Mean)
${\rm SE}(\bar D)=\sqrt{{\rm Var}(\bar D)}= \sigma_{\bar D} = \sqrt{\dfrac{\sigma_D^2}{n}}∼\sqrt{\dfrac{S_D^2}{n}}=\dfrac{S_D}{\sqrt{n}}$
여기서, $S_{D}^2 = \dfrac{\sum\limits_{i=1}^n {(d_{i}-\overline {d_i})^2}}{n-1}$
검정통계량
$t = \dfrac{(\bar X_2 – \bar X_1)-D_0}{\dfrac{S_D}{\sqrt{n}}}= \dfrac{\bar D -D_0}{\dfrac{S_D}{\sqrt{n}}}$
여기서, $D_0$는 귀무가설에서 제시된 두 모평균의 차이
대응된 두 집단의 모평균 비교 – 등분산가정 : 대응표본 t검정표
귀무가설$(H_0)$ | 검정통계량의 값 | 대립가설$(H_1)$ | 귀무가설 기각역 |
$$\mu_1-\mu_2=D_0$$ | $$t=\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}$$ | $$\mu_1-\mu_2\gt D_0$$ | $$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\gt t_{n-1\ ;\ \alpha}$$ |
$$\ \mu_1-\mu_2\lt D_0$$ | $$\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\lt-t_{n-1\ ;\ \alpha}$$ | ||
$$\ \mu_1-\mu_2\ne D_0$$ | $$\left|\dfrac{\bar{D}-D_0}{\dfrac{S_D}{\sqrt{n}}}\right|\gt t_{n-1\ ;\ \frac{\alpha}{2}}$$ |
M60-02 대응비교를 위한 표본데이터와 표본통계량
대응비교를 위한 데이터와 통계량
대응비교를 위한 표본데이터와 통계량
집단 1의 표본데이터($x_{i1}$) |
집단 2의 표본데이터($x_{i2}$) |
통계량(대응 표본데이터 차이) ($d_{i}=x_{i1}-x_{i2}$) |
$x_{11}$ $x_{21}$ $\cdots$ $x_{n1}$ |
$x_{12}$ $x_{22}$ $\cdots$ $x_{n2}$ |
$d_{1}=x_{11}-x_{12}$ $d_{2}=x_{21}-x_{22}$ $\cdots$ $d_{n}=x_{n1}-x_{n2}$ |
대응비교 통계량 |
$d_{i}$의 평균 $d_{i}$의 분산 |
$\overline {d_i}= \dfrac{\sum\limits_{i=1}^n {d_i}}{n}$ $S_{D}^2 = \dfrac{\sum\limits_{i=1}^n (d_i-\overline {d_i})^2}{n-1}$ |
M60-03 독립된 두 집단의 모평균 비교 - 등분산가정 : 독립표본 t검정
독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정
두 모평균의 차이 $D_{0}$
검정통계량
$$\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$
여기서, $D_0$는 귀무가설에서 제시된 두 모평균의 차이
$S_p^2$는 통합표본분산(pooled variation) : $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$
독립된 두 집단의 모평균 비교 – 등분산가정 : 독립표본 $t$검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\mu_2 – \mu_1=D_0$ |
$$t=\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}$$
여기서, $S_p^2=\dfrac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$ |
$\mu_2 – \mu_1 > D_0$ | $\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}<-t_{n-2\ ;\ \alpha}$ |
$\mu_2 – \mu_1 < D_0$ | $\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}>-t_{n-2\ ;\ \alpha}$ | ||
$\mu_2 – \mu_1 \ne D_0$ | $\left|\dfrac{(\bar{X}_2-\bar{X}_1)-D_0}{\sqrt{\dfrac{S_p^2}{n_1}+\dfrac{S_p^2}{n_2}}}\right|>-t_{n-2\ ;\ \frac{\alpha}{2}}$ |
M60-04 독립된 두 집단의 모평균 비교 - 등분산이 아닌 경우 : 웰치 t검정
독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정
검정통계량
$$\dfrac{\bar{X}_1-\bar{X}_2}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$
자유도
$$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$
독립된 두 집단의 모평균 비교 – 등분산이 아닌 경우 : 웰치 $t$검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$$\mu_1-\mu_2=D_0$$ |
$$t=\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}$$
여기서, $$\nu=\dfrac{\left[\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}\right]^2}{\dfrac{\left(\dfrac{S_1^2}{n_1}\right)^2}{n_1-1}+\dfrac{\left(\dfrac{S_2^2}{n_2}\right)^2}{n_2-1}}$$ |
$$\mu_1-\mu_2\gt D_0$$ | $$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\gt t_{\nu \ ;\ \alpha}$$ |
$$\mu_1-\mu_2\lt D_0$$ | $$\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\lt t_{\nu \ ;\ \alpha}$$ | ||
$$\mu_1-\mu_2\ne D_0$$ | $$\left|\dfrac{(\bar{X}_1-\bar{X}_2)}{\sqrt{\dfrac{S_1^2}{n_1}+\dfrac{S_2^2}{n_2}}}\right|\gt t_{\nu \ ;\ \frac{\alpha}{2}}$$ |
M60-05 독립된 두 집단의 모분산 비교 - 정규분포가정 : 독립표본 F검정
독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 $F$검정
$$F=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$
$$F_{(n_1-1), (n_2-1)}=\dfrac{\left(\dfrac{S_1^2}{\sigma_1^2}\right)}{\left(\dfrac{S_2^2}{\sigma_2^2}\right)}$$
여기서, $n_1$과 $n_2$은 표본의 크기
$F_{(n_1-1), (n_2-1)}$는 두 모수 $(n_1-1), (n_2-1)$를 가지는 $F$확률분포
$S_1^2$, $S_2^2$는 두 표본분산
$\sigma_1^2$, $\sigma_2^2$는 두 모분산
검정통계량
$$F = \dfrac{S_1^2}{S_2^2}$$
귀무가설
$H_{0}\ :\ \sigma_{1}^{2}=\sigma_{2}^{2}$
독립된 두 집단의 모분산 비교 – 정규분포가정 : 독립표본 F검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$$\sigma_1^2=\sigma_2^2$$ | $$F=\dfrac{S_1^2}{S_2^2}$$ | $$\sigma_1^2\gt\sigma_2^2$$ | $$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;\ \alpha}$$ |
$$\sigma_1^2\lt\sigma_2^2$$ | $$\dfrac{S_1^2}{S_2^2}\lt\ F_{n_1-1,\ n_2-1\ ;\ \alpha}$$ | ||
$$\sigma_1^2\ne\sigma_2^2$$ | $$\dfrac{S_1^2}{S_2^2}\gt F_{n_1-1,\ n_2-1\ ;1-\frac{\alpha}{2}}$$ $$\dfrac{S_1^2}{S_2^2}\lt F_{n_1-1,\ n_2-1\ ;\ \frac{\alpha} {2}}$$ |
M60-06 독립된 두 집단의 모비율 비교 - 표본크기가 큰 경우 : Z검정
독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정
표준오차
$$\dfrac{\hat{p}_1-\hat{p}_2}{\sigma_{\hat{p}_1-\hat{p}_2}}$$
여기서, $\sigma_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{p_1(1-p_1)+p_2(1-p_2)+2{p_1}{p_2}}{n}}∼\hat{p}_1-\hat{p}_2$
만일, $n_1 = n_2$이면
$$S_{\hat{p}_1-\hat{p}_2}=\sqrt{\dfrac{2\bar{p}}{n}}$$
여기서, $\bar{p}=\dfrac{(\hat{p}_1+\hat{p}_2)}{2}$
검정통계량
$$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$
여기서, $\bar{p}=\dfrac{n_1\hat{p}_1+n_2\hat{p}_2}{n_1+n_2}$
독립된 두 집단의 모비율 비교 – 표본크기가 큰 경우 : Z검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$$ p_1=p_2$$ | $$Z=\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}$$ | $$p_1\gt p_2$$ | $$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\gt z_{\alpha}$$ |
$$p_1\lt p_2$$ | $$\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\lt -z_{\alpha}$$ | ||
$$p_1\ne p_2$$ | $$\left|\dfrac{\hat{p}_1-\hat{p}_2}{\sqrt{\dfrac{\bar{p}(1-\bar{p})}{n_1}+\dfrac{\bar{p}(1-\bar{p})}{n_2}}}\right|\gt z_{\frac{\alpha}{2}}$$ |
M60-07 일원분산분석의 데이터구조와 기호
일원분산분석의 데이터구조와 기호
일원분산분석 데이터(One-way ANOVA data)
원인으로 구분 | 모평균 | 모분산 | 표본크기 | 표본 관측값 | 표본평균 | 표본분산 |
집단 1 | $\mu_{Y_1}$ | $\sigma_{Y_1}^2$ | $n_1$ | $\begin{array}{cccc}{{y}_{11}}&{{y}_{12}}&{\cdots}&{{y}_{1{n}_{1}}}\end{array}$ | ${\bar{Y}}_{{1}\cdot}$ | $S_{Y_1}^2$ |
집단 2 | $\mu_{Y_2}$ | $\sigma_{Y_2}^2$ | $n_2$ | $\begin{array}{cccc}{{y}_{21}}&{{y}_{22}}&{\cdots}&{{y}_{2{n}_{2}}}\end{array}$ | ${\bar{Y}}_{{2}\cdot}$ | $S_{Y_2}^2$ |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
집단 $k$ | $\mu_{Y_k}$ | $\sigma_{Y_k}^2$ | $n_k$ | $\begin{array}{cccc}{{y}_{k1}}&{{y}_{k2}}&{\cdots}&{{y}_{k{n}_{k}}}\end{array}$ | ${\bar{Y}}_{{k}\cdot}$ | $S_{Y_k}^2$ |
원인으로 구분된 집단 | 관측값 | 평균 |
집단 1 | $\begin{array}{cccc}{{Y}_{11}}&{{Y}_{12}}&{\cdots}&{{Y}_{1{n}_{1}}}\end{array}$ | ${\bar{Y}}_{{1}\cdot}$ |
집단 2 | $\begin{array}{cccc}{{Y}_{21}}&{{Y}_{22}}&{\cdots}&{{Y}_{2{n}_{1}}}\end{array}$ | ${\bar{Y}}_{{2}\cdot}$ |
수준 $k$ | $\begin{array}{cccc}{{Y}_{k1}}&{{Y}_{k2}}&{\cdots}&{{Y}_{k{n}_{1}}}\end{array}$ | ${\bar{Y}}_{{k}\cdot}$ |
M60-08 일원분산분석 통계모형
일원분산분석 통계모형
$$\eqalign{Y_{ij}&=\mu_i + \varepsilon_{ij}\cr&=\mu +\alpha_i +\varepsilon_{ij}}$$
여기서, $i=1,2,\cdots ,k$
$j=1,2,\cdots ,n_i$
M60-09 일원분산분석표
일원분산분석표
$$SS_T=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$
$$SS_{Tr}=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(\bar{Y}_{i\cdot}-\bar{Y}_{\cdot\cdot})^2$$
$$SS_E=\sum_{i=1}^{k} \sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_{\cdot\cdot})^2$$
$$F_0=\dfrac{MS_{Tr}}{MS_E}=\dfrac{\dfrac{SS_{Tr}}{(k-1)}}{\dfrac{SS_E}{(n-k)}}$$
일원분산분석표
요인 (factor) |
제곱합 (squared sum) |
자유도 (degrees of freedom) |
제곱평균 (mean squared) |
$F$검정통계량 (F statistic) |
처리 (Between) |
$SS_{Tr}$ | $k-1$ | ${MS}_{Tr}=\dfrac{SS_{Tr}}{k-1}$ | $F_{0}=\dfrac{MS_{Tr}}{MS_E}$ |
오차 (Within) |
$SS_E$ | $n-k$ | $MS_E=\dfrac{SS_E}{n-k}$ | |
총 (Total) |
$SS_T$ | $n-1$ | $MS_T=\dfrac{SS_T}{n-1}$ |
M60-10 일원분산분석 F검정
일원분산분석 F검정
귀무가설
$$H_0 :\alpha_1=\alpha_2=\cdots=\alpha_k=0$$
대립가설
$H_1$ : 적어도 한 $\alpha_k$는 $0$이 아니다.
검정통계량
$$F_0=\dfrac{MS_{Tr}}{MS_E}$$
기각역
$$F_0>F_{k-1,n-k;\alpha}$$
사후검정
$$HSD_{ij}=q_{k,n-k;\alpha}\cdot\sqrt{\frac{1}{2}(\frac{1}{n_i}+\frac{1}{n_j})MS_{E}}$$
일원분산분석 F검정표
귀무가설$(H_0)$ | 검정통계량의 값 | 대립가설$(H_1)$ | 귀무가설 기각역 |
$\alpha_1=\alpha_2=\cdots=\alpha_k=0$ | $F_0=\dfrac{MS_{Tr}}{MS_E}$ | 적어도 한 $\alpha_k$는 $0$보다 크다. | 검정통계량으로 $\alpha_k$가 0보다 큰지 알 수 없다. |
적어도 한 $\alpha_k$는 $0$보다 작다. | 검정통계량으로 $\alpha_k$가 0보다 작은지 알 수 없다. | ||
적어도 한 $\alpha_k$는 $0$이 아니다. | $F_0>F_{k-1,n-k;\alpha}$ |
M60-11 이원분산분석 통계모형
이원분산분석 통계모형
$$Y_{ijk}=\mu +\alpha_i +\beta_j +\gamma_{ij}+\epsilon_{ijk}$$
여기서, $i=1,2,\cdots,a$
$j=1,2,\cdots,b$
$k=1,2,\cdots,r$
$\mu$ : 총평균
$\alpha_{i}$은 $A$의 $i$번째 수준의 효과
$\beta_{j}$은 $B$의 $j$번째 수준의 효과
$\gamma_{ij}$은 $A$의 $i$번째 수준과 $B$의 $j$번째 수준과의 교호작용효과
$\epsilon_{ijk}$은 오차항으로 서로 독립, $N(0,\sigma^2)$을 따름
총제곱합($SS_T$) : 자유도는 $n-1$
$$SS_T=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{\ldots})^2$$
인자 A의 처리제곱합($SS_A$) : 자유도는 $a-1$
$$SS_A=br\sum_{i=1}^{a}(\bar{Y}_{i..}-\bar{Y}_{\ldots})^2$$
인자 B의 처리제곱합($SS_A$) : 자유도는 $b-1$
$$SS_B=ar\sum_{j=1}^{b}(\bar{Y}_{.j.}-\bar{Y}_{\ldots})^2$$
인자 A와 B의 교호작용효과를 나타내는제곱합($SS_{AB}$) : 자유도는 $(a-1)(b-1)$
$$SS_{AB}=r\sum_{i=1}^{a}\sum_{j=1}^{b}(\bar{Y}_{ij.}-\bar{Y}_{i..}-\bar{Y}_{.j.}+\bar{Y}_{\ldots})^2$$
오차제곱합($SS_E$) : 자유도는 $n-ab$
$$SS_E=\sum_{i=1}^{a}\sum_{j=1}^{b}\sum_{k=1}^{r}(Y_{ijk}-\bar{Y}_{ij.})^2$$
M60-12 이원분산분석의 제곱합과 자유도 분할
이원분산분석의 제곱합과 자유도 분할
제곱합과 자유도의 분할
제곱합
$$SS_T=SS_A+SS_B+SS_{AB}+SS_E$$
자유도
$$n-1=(a-1)+(b-1)+(a-1)(b-1)+(n-ab)$$
M60-13 이원분산분석표
이원분산분석표
이원분산분석표
요인 (factor) |
제곱합 (squared sum) |
자유도 (degrees of freedom) |
제곱평균 (mean squared) |
$F$검정통계량 (F statistic) |
요인$A$ (factor A) |
$SS_A$ | $a-1$ | ${MS_A}=\dfrac{SS_A}{a-1}$ | $F_{1}=\dfrac{MS_A}{MS_E}$ |
요인$B$ (factor B) |
$SS_B$ | $b-1$ | ${MS_B}=\dfrac{SS_B}{b-1}$ | $F_{2}=\dfrac{MS_B}{MS_E}$ |
요인$A$와 요인$B$의 상호작용 (interaction effect of A, B) |
$SS_{AB}$ | $(a-1)(b-1)$ | ${MS_{AB}}=\dfrac{SS_{AB}}{(a-1)(b-1)}$ | $F_{3}=\dfrac{MS_{AB}}{MS_E}$ |
오차 (error) |
$SS_E$ | $n-ab$ | ${MS_E}=\dfrac{SS_E}{n-ab}$ | |
전체 (total) |
$SS_T$ | $n-1$ |
M60-14 상호작용(교호작용)효과에 대한 F검정
상호작용(교호작용)효과에 대한 F검정
귀무가설
$$H_0:\gamma_{ij}=0$$
여기서, $i=1,2,\cdots,a$
$j=1,2,\cdots,b$
기각역
$$F_3=\dfrac{MS_{AB}}{MS_E}\gt F_{(a-1)(b-1),n-ab;\alpha}$$
상호작용(교호작용)효과에 대한 F검정표
귀무가설$(H_0)$ | 검정통계량의 값 | 대립가설$(H_1)$ | 귀무가설 기각역 |
$\gamma_{ij}=0$ | $F_3=\dfrac{MS_{AB}}{MS_E}$ | $\gamma_{ij} > 0$ | 검정통계량으로 $\gamma_{ij}$가 0보다 큰 지 알 수 없다. |
$\gamma_{ij} < 0$ | 검정통계량으로 $\gamma_{ij}$가 0보다 작은 지 알 수 없다. | ||
$\gamma_{ij}\neq0$ | $F_3\gt F_{(a-1)(b-1),n-ab;\alpha}$ |
M60-15 원인 A의 주효과에 대한 F검정
원인 A의 주효과에 대한 F검정
귀무가설
$$H_0:\alpha_1=\alpha_2=\cdots=\alpha_a=0$$
기각역
$$F_1=\dfrac{MS_A}{MS_E}\gt F_{a-1,n-ab;\alpha}$$
원인 A의 주효과에 대한 F검정표
귀무가설$(H_0)$ | 검정통계량의 값 | 대립가설$(H_1)$ | 귀무가설 기각역 |
$\alpha_1=\alpha_2=\cdots=\alpha_a=0$ | $F_1=\dfrac{MS_A}{MS_E}$ | 적어도 한 $\alpha_a$는 0보다 크다. | 검정통계량으로 $\alpha_a$가 0보다 큰 지 알 수 없다. |
적어도 한 $\alpha_a$는 0보다 작다. | 검정통계량으로 $\alpha_a$가 0보다 작은 지 알 수 없다. | ||
적어도 한 $\alpha_a$는 0이 아니다. | $F_1\gt F_{a-1,n-ab;\alpha}$ |
M60-16 원인 B의 주효과에 대한 F검정
원인 B의 주효과에 대한 F검정
귀무가설
$$H_0:\beta_1=\beta_2=\cdots=\beta_b=0$$
기각역
$$F_2=\dfrac{MS_B}{MS_E}\gt F_{b-1,n-ab;\alpha}$$
원인 B의 주효과에 대한 F검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\beta_1=\beta_2=\cdots=\beta_b=0$ | $F_2=\dfrac{MS_B}{MS_E}$ | 적어도 한 $\beta_b$는 $0$보다 크다. | 검정통계량으로 $\beta_b$가 $0$보다 큰 지 알 수 없다. |
적어도 한 $\beta_b$는 $0$보다 작다. | 검정통계량으로 $\beta_b$가 $0$보다 작은 지 알 수 없다. | ||
적어도 한 $\beta_b$는 $0$이 아니다. | $F_2\gt F_{b-1,n-ab;\alpha}$ |
M60-17 중앙값의 부호검정 : Spearman rank test
중앙값의 부호검정 : Spearman rank test
중앙값의 부호검정표
귀무가설$(H_0)$ | 검정통계량의 값 | 대립가설$(H_1)$ | 귀무가설 기각역 |
$M=M_0$ | $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$ | $M> M_0$ | $n_{+}> B{\left({n,0.5}\right)}_{\alpha}$ |
$M< M_0$ | $n_{+}< B{\left({n,0.5}\right)}_{1-\alpha}$ | ||
$M\ne M_0$ | $n_{+}< B{\left({n,0.5}\right)}_{1-\frac{\alpha}{2}}$ 또는 $n_{+}> B{\left({n,0.5}\right)}_{\frac{\alpha}{2}}$ |
M60-18 중앙값의 부호검정 - 표본크기가 큰 경우
중앙값의 부호검정 – 표본크기가 큰 경우
만약 관측값 중에 $M_0$와 동일한 값이 있으면 그 관측값은 검정에서 사용하지 않는다. 즉, $n$을 감소시킨다.
중앙값의 부호검정표 – 표본크기가 큰 경우
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$M=M_0$ | $n_{+}=’+{\rm 부호의}\ {\rm 갯수}’$ | $M> M_0$ | $\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}> z_{\alpha}$ |
$M< M_0$ | $\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}<-z_{\alpha}$ | ||
$M\ne M_0$ | $\left|\dfrac{n_{+}-0.5n}{\sqrt{0.25n}}\right|> z_{\frac{\alpha}{2}}$ |
M60-19 부호순위검정 통계모형
부호순위합검정 통계모형
$$X_i=M_0+\varepsilon_i$$
여기서, $i=1,2,\cdots ,n$
M60-20 중앙값의 부호순위검정 : Wicoxon Signed rank test
중앙값의 부호순위검정 : Wilcoxon Signed rank test
$$\mathrm{E}[R_+]=\dfrac{n(n+1)}{4}$$
$$\mathrm{Var}[R_+]=\dfrac{n(n+1)(2n+1)}{24}$$
중앙값의 부호순위합검정표 : Wilcoxon rank-sum test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$M=M_0$ | $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합 | $M> M_0$ | $R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$ |
$M< M_0$ | $R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$ | ||
$M\ne M_0$ | $R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$ |
M60-21 중앙값의 부호순위검정 - 표본크기가 큰 경우 : Wicoxon Signed rank test
중앙값의 부호순위합검정 – 표본크기가 큰 경우 : Wilcoxon Signed rank test
순위 | $R_{+}$의 가능한 순위 | ||
1 | 2 | 3 | |
$-$ | $-$ | $-$ | 0 |
$+$ | $-$ | $-$ | 1 |
$-$ | $+$ | $-$ | 2 |
$-$ | $-$ | $+$ | 3 |
$+$ | $+$ | $-$ | 3 |
$+$ | $-$ | $+$ | 4 |
$-$ | $+$ | $+$ | 5 |
$+$ | $+$ | $+$ | 6 |
$R_{+}=x$ | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
$P(R_{+}=x)$ | ${{1}\over{8}}$ | ${{1}\over{8}}$ | ${{1}\over{8}}$ | ${{2}\over{8}}$ | ${{1}\over{8}}$ | ${{1}\over{8}}$ | ${{1}\over{8}}$ |
$$\mathrm{Var}[R_+]=\dfrac{1}{24}\left[n(n+1)(2n+1)-\dfrac{1}{2}\sum\limits_{j=1}^{g}t_{j}(t_{j}-1)(t_{j}+1)\right]$$
여기서, $g$는 동점집단의 수
$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)
표본크기가 큰 경우 – 중앙값의 부호순위합검정(윌콕슨검정)표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$M=M_0$ | $R_{+}=\left|{x_{i}-M_{0}}\right|$순위의 $+$부호 데이터의 순위합 | $M> M_0$ | $\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{>} z_{\alpha}$ |
$M< M_0$ | $\dfrac{R_+ -E(R_+)}{\sqrt{V(R_+)}}{<}-z_{\alpha}$ | ||
$M\ne M_0$ | $\left|\dfrac{R_+ -E(R_+)} {\sqrt{V(R_+)}}\right|{>} z_{\frac{\alpha}{2}}$ |
M60-22 순위합검정 모형 : Wilcoxon rank-sum Model
순위합검정 모형 : Wilcoxon rank-sum Model
$$X_i=M_1+\varepsilon_i$$
여기서, $i=1,2,\cdots, n_1$
$$Y_j=M_1+\Delta+\varepsilon_j$$
여기서, $j=1,2,\cdots,n_2$
$M_2=M_1+\Delta$
M60-23 순위합검정 : Wilcoxon rank-sum test
순위합검정 : Wilcoxon rank-sum test
$$\mathrm{E}[R_2]=\dfrac{n_2(n_1+n_2+1)}{2}$$
$$V(R_2)=\dfrac{n_1 n_2(n_1+n_2+1)}{12}$$
순위합검정표 : Wilcoxon rank-sum test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$M_1=M_2$ | $R_{2}=’Y{\rm 표본에}\ {\rm 부여한}\ {\rm 순위합}’$ | $M_1> M_2$ | $R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\alpha}$ |
$M_1< M_2$ | $R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\alpha}$ | ||
$M_1\ne M_2$ |
$R_{2}{<} w_{2}{\left({n_{1},n_{2}}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{2}{>} w_{2}{\left({n_{1},n_{2}}\right)}_{\frac{\alpha}{2}}$ |
M60-24 대응비교를 위한 데이터와 통계량
대응비교를 위한 데이터와 통계량
대응비교를 위한 데이터와 통계량
모집단 1의 표본($x_{i1}$) | 모집단 2의 표본($x_{i2}$) | 차이 $d_{i}=x_{i1}-x_{i2}$ |
$x_{11}$ | $x_{12}$ | $d_{1}=x_{11}-x_{12}$ |
$x_{21}$ | $x_{22}$ | $d_{2}=x_{21}-x_{22}$ |
$\cdots$ | $\cdots$ | $\cdots$ |
$x_{n1}$ | $x_{n2}$ | $d_{n}=x_{n1}-x_{n2}$ |
M60-25 대응표본 - 부호순위합검정 : Wilcoxon Signed rank test
대응표본 – 부호순위합검정 : Wilcoxon Signed rank test
대응표본 – 부호순위합검정 : Wilcoxon Signed rank test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$M_d=0$ | $R_{+}=’\left|{d_{i}}\right|\ {\rm 순위에서}+{\rm 부호}\ {\rm 데이터의}\ {\rm 순위합}’$ | $M_d> 0$ | $R_{+}{>} w_{+}{\left({n}\right)}_{\alpha}$ |
$M_d< 0$ | $R_{+}{<} w_{+}{\left({n}\right)}_{1-\alpha}$ | ||
$M_d\ne 0$ | $R_{+}{<} w_{+}{\left({n}\right)}_{1-\frac{\alpha}{2}}$ 또는 $R_{+}{>} w_{+}{\left({n}\right)}_{\frac{\alpha}{2}}$ |
M60-26 각 수준별 확률표본에 대한 기호
각 수준별 확률표본에 대한 기호
각 수준별 확률표본에 대한 기호
수준 1 | 수준 2 | $\cdots$ | 수준 | |
$X_{11}$ | $X_{21}$ | $\cdots$ | $X_{k1}$ | |
$X_{12}$ | $X_{22}$ | $\cdots$ | ||
$\cdots$ | $\cdots$ | $X_{k2}$ | ||
$X_{1n_{1}}$ | $X_{2n_{2}}$ | $X_{kn_{k}}$ | ||
수준 1 평균 | 수준 2 평균 | $\cdots$ | 수준 $k$평균 | 총평균 |
${\bar X}_{1\cdot}$ | ${\bar X}_{2\cdot}$ | ${\bar X}_{k\cdot}$ | ${\bar X}_{\cdot\cdot}$ |
M60-27 비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test
비모수 분산분석 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test
통계모형
$$X_{ij}=\mu+\tau_i+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots,n_i$$
여기서, $\sum\limits_{i=1}^{k}\tau_i=0$
검정
귀무가설
$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$
대립가설
$H_1$ : 적어도 하나의 $\tau_i$는 $0$이 아니다
각 수준별 순위 데이터에 대한 기호
수준 1 | 수준 2 | $\cdots$ | 수준 $k$ | |
$R_{11}$ | $R_{21}$ | $\cdots$ | $R_{k1}$ | |
$R_{12}$ | $R_{22}$ | $R_{k2}$ | ||
$\cdots$ | $\cdots$ | $\cdots$ | ||
$R_{1n_{1}}$ | $R_{2n_{2}}$ | $R_{kn_{k}}$ | ||
수준 1 합 | 수준 2 합 | $\cdots$ | 수준 합 | |
$R_{1\cdot}$ | $R_{2\cdot}$ | $R_{k\cdot}$ | ||
수준 1 평균 | 수준 2 평균 | $\cdots$ | 수준 평균 | 총평균 |
${\bar R}_{1\cdot}$ | ${\bar R}_{2\cdot}$ | ${\bar R}_{k\cdot}$ | ${\bar R}_{\cdot\cdot}=\dfrac{(n+1)}{2}$ |
$$\eqalign{SS_T&=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(R_{ij}-\bar{R}_{\cdot\cdot})^2\cr&=\sum_{k=1}^{n}(k-\bar{R}_{\cdot\cdot})^2\cr&=n(n+1)(n-1)}$$
$$SS_{Tr}=\sum_{i=1}^{k}\sum_{j=1}^{n_i}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$
$$SS_T=SS_{Tr}+SS_E$$
$$\eqalign{F&=\dfrac{MS_{Tr}}{MSE}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SSE}{n-k}}\cr&=\dfrac{\dfrac{SS_{Tr}}{k-1}}{\dfrac{SS_T-SS_{Tr}}{n-k}}\cr&=\dfrac{\dfrac{n-k}{k-1}}{\dfrac{SS_T}{SS_{Tr}}-1}}$$
$$\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$$
비모수 분산분석 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_0$) | 귀무가설 기각역 |
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$ | $\eqalign{H&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}n_i(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=\dfrac{12}{n(n+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3(n+1)}$ | 적어도 하나의 $\tau_i$는 0보다 크다 | 검정통계량으로 $\tau_i$가 0보다 큰 지 알 수 없다 |
적어도 하나의 $\tau_i$는 0보다 작다 | 검정통계량으로 $\tau_i$가 0보다 작은 지 알 수 없다 | ||
적어도 하나의 $\tau_i$는 0이 아니다 | $H>h(n_{1},\ n_{2},\ \cdots ,\ n_{k})_{\alpha}$ |
M60-28 비모수 분산분석 - 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test
비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정 Non-parametric ANOVA : Kruscal Wallis test
$$H’=\dfrac{H}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{n^3-n}}$$
여기서, $g$는 동점집단의 수
$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)
$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$
비모수 분산분석 – 표본크기가 큰 경우 : 크루스칼–왈리스검정표 Non-parametric ANOVA : Kruscal Wallis test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\tau_{1}=\tau_{2}=\cdots=\tau_{k}=0$ | $H$ | 적어도 하나의 $\tau_{i}$는 0보다 크다 | 검정통계량으로 $\tau_{i}$가 0보다 큰 지 알 수 없다 |
적어도 하나의 $\tau_{i}$는 0보다 작다 | 검정통계량으로 $\tau_{i}$가 0보다 작은 지 알 수 없다 | ||
적어도 하나의 $\tau_{i}$는 0이 아니다 | $H>\chi_{k-1\ ;\ \alpha}^{2}$ |
M60-29 순위합검정 통계모형 Wilcoxon rank-sum Model
순위합검정 통계모형 Wilcoxon rank-sum Model
$$X_{ij}=\mu+\tau_i+\beta_j+\varepsilon_{ij},\ i=1,2,\cdots,k;\ j=1,2,\cdots ,n$$
가설검정
귀무가설
$$H_0 : \tau_1=\tau_2=\cdots=\tau_k=0$$
대립가설
$H_1$ : 적어도 하나의 $\tau_i$는 $0$이 아니다
각 수준별 순위 데이터에 대한 기호
치리 블록 |
수준 1 | 수준 2 | $\cdots$ | 수준 $k$ | |
1 | $R_{11}$ | $R_{21}$ | $\cdots$ | $R_{k1}$ | |
2 | $R_{12}$ | $R_{22}$ | $R_{k2}$ | ||
$\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | ||
$n$ | $R_{1n}$ | $R_{2n}$ | $R_{kn}$ | ||
순위합 | $R_{1\cdot}$ | $R_{2\cdot}$ | $\cdots$ | $R_{k\cdot}$ | |
평균순위 | ${\bar R}_{1\cdot}$ | ${\bar R}_{2\cdot}$ | $\cdots$ | ${\bar R}_{k\cdot}$ | 총평균 $\bar R_{\cdot\cdot}=\dfrac{(k+1)}{2}$ |
$$SS_{Tr}=\sum_{i=1}^{k}n(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2$$
$$SS_T=SS_{Tr}+SS_E$$
$$\eqalign{F&=\dfrac{MS_{Tr}}{MS_E}\cr&=c\dfrac{SS_{Tr}}{{SS_T-SS{Tr}-SS_E}}}$$
$$\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$$
M60-30 비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test
비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정 Friedman test
비모수 원인 1개 및 블럭화변수 1개 : 프리드만검정표 Friedman test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$ | $\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$ | 적어도 하나의 $\tau_{i}$는 크다 | 검정통계량으로 $\tau_{i}$가 큰지 알 수 없다 |
적어도 하나의 $\tau_{i}$는 작다 | 검정통계량으로 $\tau_{i}$가 작은지 알 수 없다 | ||
적어도 하나의 $\tau_{i}$는 다르다 | $S>s{\left({k,\ n}\right)}_{\alpha}$ |
M60-31 비모수 원인 1개 및 블럭화변수 1개 - 표본크기가 큰 경우 : 프리드만검정 Friedman test
비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정 Friedman test
$$S’=\dfrac{S}{1-\sum\limits_{j=1}^{g}\dfrac{T_j}{np(p^2-1)}}$$
여기서, $g$는 동점집단의 수
$t_j$는 $j$번째 동점집단의 크기(동점집단에 포함된 관측값의 개수)
$T_j=\sum\limits_{j=1}^{g}t_j(t_j-1)(t_j+1)$
$X$ | ${x}_{1}{,}\hspace{0.33em}{x}_{2}{,}\cdots{,}\hspace{0.33em}{x}_{k}$ | 합계 |
${P}\left({{X}{=}{x}}\right)$ | ${p}_{1}{,}\hspace{0.33em}{p}_{2}{,}\cdots{,}\hspace{0.33em}{p}_{k}$ | 1 |
비모수 원인 1개 및 블럭화변수 1개 – 표본크기가 큰 경우 : 프리드만검정표 Friedman test table
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\ \tau_{1}=\tau_{2}=\cdots=\tau_{k}$ | $\eqalign{S&=\dfrac{12}{k(k+1)}\mathrm{SS_{Tr}}\cr&=\dfrac{12n}{k(k+1)}\sum_{i=1}^{k}(\bar{R}_{i\cdot}-\bar{R}_{\cdot\cdot})^2\cr&=12\dfrac{12}{nk(k+1)}\sum_{i=1}^{k}R_{i\cdot}^{2}-3n(k+1)}$ | 적어도 하나의 $\tau_{i}$는 크다 | 검정통계량으로 $\tau_{i}$가 큰 지 알 수 없다 |
적어도 하나의 $\tau_{i}$는 작다 | 검정통계량으로 $\tau_{i}$가 작은 지 알 수 없다 | ||
적어도 하나의 $\tau_{i}$는 다르다 | $S>\chi_{k-1\ ;\ \alpha}^{2}$ |
M60-32 두 범주형 변수의 r X c 교차표 관측빈도수
두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$)
두 범주형 변수의 $r\times c$ 교차표 관측빈도수($O_{ij}$) 기호표
관측빈도수 $O_{ij}$ |
범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$O_{11}$ |
$O_{12}$ |
$\cdots$ |
$O_{1c}$ |
$T_{1\cdot}$ |
$A_{2}$ |
$O_{21}$ |
$O_{22}$ |
$\cdots$ |
$O_{2c}$ |
$T_{2\cdot}$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$O_{r1}$ |
$O_{r2}$ |
$\cdots$ |
$O_{rc}$ |
$T_{r\cdot}$ |
|
열의 합 | $T_{\cdot 1}$ | $T_{\cdot 2}$ | $\cdots$ | $T_{\cdot c}$ | $n$ |
M60-33 두 범주형 변수의 r X c 교차표 기대빈도수
두 범주형 변수의 교차표 기대빈도수
두 범주형 변수의 교차표 관찰빈도수의 주변확률분포(marginal probability distribution)로 기대빈도수 산출
$$E_{ij}=n\left(\dfrac{T_{i·}}{n}\right)\left(\dfrac{T_{·j}}{n}\right)=T_{i·}\left(\dfrac{T_{·j}}{n}\right)$$
두 범주형 변수의 교차표 기대빈도수 기호표
기대빈도수 $E_{ij}$ |
범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$E_{11}=T_{1\cdot}{{T_{\cdot 1}}\over{n}}$ |
$E_{12}=T_{1\cdot}{{T_{\cdot 2}}\over{n}}$ |
$\cdots$ |
$E_{1c}=T_{1\cdot}{{T_{\cdot c}}\over{n}}$ |
$T_{1\cdot}$ |
$A_{2}$ |
$E_{21}=T_{2\cdot}{{T_{\cdot 1}}\over{n}}$ |
$E_{22}=T_{2\cdot}{{T_{\cdot 2}}\over{n}}$ |
$\cdots$ |
$E_{2c}=T_{2\cdot}{{T_{\cdot c}}\over{n}}$ |
$T_{2\cdot}$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$E_{r1}=T_{r\cdot}{{T_{\cdot 1}}\over{n}}$ |
$E_{r2}=T_{r\cdot}{{T_{\cdot 2}}\over{n}}$ |
$\cdots$ |
$E_{rc}=T_{r\cdot}{{T_{\cdot c}}\over{n}}$ |
$T_{r\cdot}$ |
|
열의 합 | $T_{\cdot 1}$ | $T_{\cdot 2}$ | $\cdots$ | $T_{\cdot c}$ | $n$ |
M60-35 두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정
두 범주형 변수의 동일성 : 교차분석 피어슨카이제곱검정
검정통계량
$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$
귀무가설($H_0$) 기각역
$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}\gt\chi_{(r-1)(c-1);\alpha}^2$$
두 범주형 변수의 $r\times c$ 교차표 관측빈도수와 기대빈도수의 차이로 생성한 확률변수($Z^2$) 기호표
$Z^2$ | 범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$\dfrac{(O_{11}-E_{11})^2}{E_{11}}$ |
$\dfrac{(O_{12}-E_{12})^2}{E_{12}}$ |
$\cdots$ |
$\dfrac{(O_{1c}-E_{1c})^2}{E_{1c}}$ |
$$\sum_{j=1}^{c}\dfrac{(O_{1j}-E_{1j})^2}{E_{1j}}$$ |
$A_{2}$ |
$\dfrac{(O_{21}-E_{21})^2}{E_{21}}$ |
$\dfrac{(O_{22}-E_{22})^2}{E_{22}}$ |
$\cdots$ |
$\dfrac{(O_{2c}-E_{2c})^2}{E_{2c}}$ |
$$\sum_{j=1}^{c}\dfrac{(O_{2j}-E_{2j})^2}{E_{2j}}$$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$\dfrac{(O_{r1}-E_{r1})^2}{E_{r1}}$ |
$\dfrac{(O_{r2}-E_{r2})^2}{E_{r2}}$ |
$\cdots$ |
$\dfrac{(O_{rc}-E_{rc})^2}{E_{rc}}$ |
$$\sum_{j=1}^{c}\dfrac{(O_{rj}-E_{rj})^2}{E_{rj}}$$ |
|
열의 합 | $$\sum_{i=1}^{r}\dfrac{(O_{i1}-E_{i1})^2}{E_{i1}}$$ | $$\sum_{i=1}^{r}\dfrac{(O_{i2}-E_{i2})^2}{E_{i2}}$$ | $\cdots$ | $$\sum_{i=1}^{r}\dfrac{(O_{ic}-E_{ic})^2}{E_{ic}}$$ | $$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$$ |
두 범주형 확률변수의 동일성 : 교차분석 피어슨카이제곱검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\chi_{obs}^2=0$ | $\chi_{obs}^2=\sum\limits_{i=1}^{r}\sum\limits_{j=1}^{c}\dfrac{(O_{ij}-E_{ij})^2}{E_{ij}}$ | $\chi_{obs}^2<0$ | 검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다. |
$\chi_{obs}^2>0$ | 검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다. | ||
$\chi_{obs}^2\neq0$ | $\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$ |
M60-34 한 범주형 변수의 확률분포표 확률 기호
한 범주형 변수의 확률분포표 확률 기호
한 범주형 변수의 확률분포표 확률 기호
확률 $P_k$ |
범주형 변수 $X$ | 합 | |||
${X}_{1}$ | ${X}_{2}$ | $\cdots$ | ${X}_{k}$ | ||
${P}_{1}$ | ${P}_{2}$ | $\cdots$ | ${P}_{k}$ | 1 |
M60-36 두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정
두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정
검정통계량
$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$
귀무가설($H_0$) 기각역
$$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}\gt\chi_{(r-1)(c-1);\alpha}^2$$
두 범주형 변수의 $r\times c$ 교차표 관측확률 기호표
관측확률 $P_{rc}$ |
범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$P_{11}$ |
$P_{12}$ |
$\cdots$ |
$P_{1c}$ |
$P_{1\cdot}$ |
$A_{2}$ |
$P_{21}$ |
$P_{22}$ |
$\cdots$ |
$P_{2c}$ |
$P_{2\cdot}$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$P_{r1}$ |
$P_{r2}$ |
$\cdots$ |
$P_{rc}$ |
$P_{r\cdot}$ |
|
열의 합 | $P_{\cdot 1}$ | $P_{\cdot 2}$ | $\cdots$ | $P_{\cdot c}$ | 1 |
두 범주형 변수의 $r\times c$ 교차표 기대확률 기호표
기대확률 $P_{rc}$ |
범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$P_{1\cdot}P_{\cdot 1}$ |
$P_{1\cdot}P_{\cdot 2}$ |
$\cdots$ |
$P_{1\cdot}P_{\cdot c}$ |
$P_{1\cdot}$ |
$A_{2}$ |
$P_{2\cdot}P_{\cdot 1}$ |
$P_{2\cdot}P_{\cdot 2}$ |
$\cdots$ |
$P_{2\cdot}P_{\cdot c}$ |
$P_{2\cdot}$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$P_{r\cdot}P_{\cdot 1}$ |
$P_{r\cdot}P_{\cdot 2}$ |
$\cdots$ |
$P_{r\cdot}P_{\cdot c}$ |
$P_{r\cdot}$ |
|
열의 합 | $P_{\cdot 1}$ | $P_{\cdot 2}$ | $\cdots$ | $P_{\cdot c}$ | 1 |
두 범주형 변수의 $r\times c$ 교차표 관측확률과 기대확률의 편차로 생성한 새로운 확률변수($Z^2$) 기호표
$Z^2$ | 범주형 변수 $B$ | 행의 합 | ||||
$B_{1}$ | $B_{2}$ | $\cdots$ | $B_{c}$ | |||
범주형 변수 $A$ |
$A_{1}$ |
$\dfrac{(P_{11}-P_{1\cdot}P_{\cdot 1})^2}{P_{1\cdot}P_{\cdot 1}}$ |
$\dfrac{(P_{12}-P_{1\cdot}P_{\cdot 2})^2}{P_{1\cdot}P_{\cdot 2}}$ |
$\cdots$ |
$\dfrac{(P_{1c}-P_{1\cdot}P_{\cdot c})^2}{P_{1\cdot}P_{\cdot c}}$ |
$$\sum_{j=1}^{c}\dfrac{(P_{1j}-P_{1\cdot}P_{\cdot j})^2}{P_{1\cdot}P_{\cdot j}}$$ |
$A_{2}$ |
$\dfrac{(P_{21}-P_{2\cdot}P_{\cdot 1})^2}{P_{2\cdot}P_{\cdot 1}}$ |
$\dfrac{(P_{22}-P_{2\cdot}P_{\cdot 2})^2}{P_{2\cdot}P_{\cdot 2}}$ |
$\cdots$ |
$\dfrac{(P_{2c}-P_{2\cdot}P_{\cdot c})^2}{P_{2\cdot}P_{\cdot c}}$ |
$$\sum_{j=1}^{c}\dfrac{(P_{2j}-P_{2\cdot}P_{\cdot j})^2}{P_{2\cdot}P_{\cdot j}}$$ |
|
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
$\cdots$ |
|
$A_{r}$ |
$\dfrac{(P_{r1}-P_{r\cdot}P_{\cdot 1})^2}{P_{r\cdot}P_{\cdot 1}}$ |
$\dfrac{(P_{r2}-P_{r\cdot}P_{\cdot 2})^2}{P_{r\cdot}P_{\cdot 2}}$ |
$\cdots$ |
$\dfrac{(P_{rc}-P_{r\cdot}P_{\cdot c})^2}{P_{r\cdot}P_{\cdot c}}$ |
$$\sum_{j=1}^{c}\dfrac{(P_{rj}-P_{r\cdot}P_{\cdot j})^2}{P_{r\cdot}P_{\cdot j}}$$ |
|
열의 합 | $$\sum_{i=1}^{r}\dfrac{(P_{i1}-P_{i\cdot}P_{\cdot 1})^2}{P_{i\cdot}P_{\cdot 1}}$$ | $$\sum_{i=1}^{r}\dfrac{(P_{i2}-P_{i\cdot}P_{\cdot 2})^2}{P_{i\cdot}P_{\cdot 2}}$$ | $\cdots$ | $$\sum_{i=1}^{r}\dfrac{(P_{ic}-P_{i\cdot}P_{\cdot c})^2}{P_{i\cdot}P_{\cdot c}}$$ | $$\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$ |
두 범주형 변수의 확률분포 비교 : 교차분석 피어슨카이제곱검정표
귀무가설($H_0$) | 검정통계량의 값 | 대립가설($H_1$) | 귀무가설 기각역 |
$\chi_{obs}^2=0$ | $$\chi_{obs}^2=\sum_{i=1}^{r}\sum_{j=1}^{c}\dfrac{(P_{ij}-P_{i\cdot}P_{\cdot j})^2}{P_{i\cdot}P_{\cdot j}}$$ | $\chi_{obs}^2<0$ | 검정통계량으로 $\chi_{obs}^2$가 0보다 작은 지 알 수 없다. |
$\chi_{obs}^2>0$ | 검정통계량으로 $\chi_{obs}^2$가 0보다 큰 지 알 수 없다. | ||
$\chi_{obs}^2\neq0$ | $\chi_{obs}^2>\chi_{(r-1)(c-1);\alpha}^2$ |