웹에 공유된 정보를 활용하여 문제를 만들어 풀어 보았습니다.
올바른 답인지도 불확실하며, 문제가 올바른지도 불확실합니다.
참고한 자료 link
문제
aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다.
공장별로 생산되는 제품 무게에 차이가 있는지 검증하라.
* 데이터 생성용 script
library(dplyr)
mtcars %>% mutate(rank = rank(mpg)) %>%
mutate(group = ifelse(cyl==4,'x',ifelse(cyl==6,'y','z'))) %>%
arrange(rank) %>% select ( group,rank) -> aa
row.names(aa) <- NULL
5-1. 연구가설과 귀무가설을 설정하시오
더보기
연구가설 : 3개 공장에서 생산되는 제품무게의 중위수는 모두 같다
귀무가설 : 3개 공장에서 생산되는 제품무게의 중위수가 모두 같지는 않다
5-2. 검정통계량을 구하고 가설을 채택하시오
관측치가 없고 순위정보만 있으므로 Kruskal–Wallis test 를 수행합니다.
library(tidyverse)
library(knitr)
bb <- aa %>%
group_by(group) %>%
summarise(rank_sum = sum(rank),
rank_mean = mean(rank),
n = n() )
bb
# 그룹별 관측치가 5개 이상이므로 H-Value 대신 Chi-square 통계량을 구합니다.
bb %>%
summarise(N = sum(n),
S_t_2 = sum(rank_sum^2/n),
S_r_2 = sum(aa$rank^2),
C = (N*(N+1)^2 / 4),
Chisq = ((N-1)*(S_t_2 - C)) / (S_r_2 - C)) %>%
kable()
# Chi-square 통계량은 25.74616 입니다. 3개 공장이므로 자유도 2 의 카이제곱 p-value 를 구합니다.
> pchisq(25.74616, df=2, lower.tail=F)
[1] 2.566211e-06
p-value 가 0.05 미만이므로 유의수준 0.05 에서 귀무가설을 기각하고 대립가설을 채택합니다.
즉, 3개 공장에서 생산되는 제품무게의 중위수가 모두 같지는 않습니다.
문제 복원 참고 자료
출처 : https://stherhj.tistory.com/191
'ADP (R)' 카테고리의 다른 글
Scheffe 사후검정 (0) | 2022.07.31 |
---|---|
오늘의 ADP 준비 / 2022-07-29 금(D58) (0) | 2022.07.29 |
[ADP 실기 study log] 25회 5번 공장 순위 문제 kruskal.test (0) | 2022.07.27 |
[Adp 실기 기출 풀이] 25회 3-3 조건부 확률 문제 (0) | 2022.07.26 |
오늘의 ADP 준비 / 2022-07-26 화(D61) (0) | 2022.07.26 |