ADP (R)

[Adp 실기 기출 풀이] 25회 5번 공장 순위 문제

멋쟁이천재사자 2022. 7. 29. 20:13

 

웹에 공유된 정보를 활용하여 문제를 만들어 풀어 보았습니다.

올바른 답인지도 불확실하며, 문제가 올바른지도 불확실합니다.

 

참고한 자료 link

 

문제

 

aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다.

공장별로 생산되는 제품 무게에 차이가 있는지 검증하라. 

 

* 데이터 생성용 script

library(dplyr)
mtcars %>% mutate(rank = rank(mpg)) %>% 
  mutate(group = ifelse(cyl==4,'x',ifelse(cyl==6,'y','z'))) %>% 
  arrange(rank) %>% select ( group,rank) -> aa
row.names(aa) <- NULL

 

5-1. 연구가설과 귀무가설을 설정하시오

 

더보기

연구가설 : 3개 공장에서 생산되는 제품무게의 중위수는 모두 같다

귀무가설 : 3개 공장에서 생산되는 제품무게의 중위수가 모두 같지는 않다

 


5-2. 검정통계량을 구하고 가설을 채택하시오

관측치가 없고 순위정보만 있으므로 Kruskal–Wallis test 를 수행합니다.

library(tidyverse)
library(knitr)
bb <- aa %>% 
  group_by(group) %>%
  summarise(rank_sum  = sum(rank),
            rank_mean = mean(rank),
            n         = n() ) 
bb

# 그룹별 관측치가 5개 이상이므로 H-Value 대신 Chi-square 통계량을 구합니다.
bb %>%
  summarise(N     = sum(n),
            S_t_2 = sum(rank_sum^2/n),
            S_r_2 = sum(aa$rank^2),
            C     = (N*(N+1)^2 / 4),
            Chisq = ((N-1)*(S_t_2 - C))  / (S_r_2 - C)) %>% 
  kable()

 

# Chi-square 통계량은 25.74616 입니다. 3개 공장이므로 자유도 2 의 카이제곱 p-value 를 구합니다.
> pchisq(25.74616, df=2, lower.tail=F)
[1] 2.566211e-06

p-value 가 0.05 미만이므로 유의수준 0.05 에서 귀무가설을 기각하고 대립가설을 채택합니다.

즉, 3개 공장에서 생산되는 제품무게의 중위수가 모두 같지는 않습니다.

 

 

문제 복원 참고 자료

 

출처 : https://stherhj.tistory.com/191