ADP (R)

[Adp 실기 기출 풀이] 23회 진공관 수명

멋쟁이천재사자 2022. 8. 16. 21:06

9월 25일 26회 시험을 준비하고 있습니다.

23회 통계 파트 중 부호 검정 문제를 만들어서 풀어보았습니다.

 

1. 문제 (2022-08-30 update)

 

공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음. 유의수준 5%에서 부호 검정하시오. 12개 샘플의 수명은 8800, 9500, 9600, 10000, 10400, 9600, 10300, 9500, 9600, 7100, 10000,7200 이다

 

1. 연구가설 귀무가설 작성(5)
2. 유효한 샘플의 수를 계산(5)
3. 검정통계량 및 연구가설 채택 여부 작성(5)

 

2. 답안

 

1. 연구가설 귀무가설 작성(5)

 

1만 시간이라는 공장의 주장은 1만 시간 이상이라는 주장이라고 이해할 수 있다.

귀무가설: 진공관 모집단의 중위수는 1만 시간이다.
대립가설: 진공관 모집단의 중위수는 1만 시간보다 작다.


2. 유효한 샘플의 수를 계산(5)

 

data <- c(8800, 9500, 9600, 10000, 10400, 9600, 10300, 9500, 9600, 7100,10000,7200)
sum(data != 10000)

[1] 10

 

유효한 샘플은 모수 10000 을 제외한 샘플로서 10개임.

 

3. 검정통계량 및 연구가설 채택 여부 작성(5)

 

library(BSDA)
SIGN.test(data, md=10000, alternative = "less")

p-value 0.05469 는 0.05 보다 큼. 연구 가설을 기각함.

 

 

 

 

 

3. Study History

 

유효한 샘플수를 계산할 때, 표본의 중위수와 같은 값을 제외해서 구했는데 잘못된 방식입니다.

기존 문제의 표본에는 모수와 같은 1만 시간의 값이 없었는데, 신규 문제에서는 2개 표본을 1만 시간으로 수정했습니다.  

모수와 같은 값을 제외하는 방식으로 유효 샘플수를 구하는 것으로 답안을 수정했습니다.

 

- 8/17버전 문제 & 답안

공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음. 유의수준 5%에서 부호 검정하시오. 12개 샘플의 수명은 8800, 9500, 9600, 10500, 10400, 9600, 10300, 9500, 9600, 7100,10100,7200 이다

 

1. 연구가설 귀무가설 작성(5)
2. 유효한 샘플의 수를 계산(5)
3. 검정통계량 및 연구가설 채택 여부 작성(5)

 

1. 연구가설 귀무가설 작성(5)

 

1만 시간이라는 공장의 주장은 1만 시간 이상이라는 주장이라고 이해할 수 있다.

귀무가설: 진공관 모집단의 중위수는 1만 시간이다.
대립가설: 진공관 모집단의 중위수는 1만 시간보다 작다.


2. 유효한 샘플의 수를 계산(5)

 

data <- c(8800, 9500, 9600, 10500, 10400, 9600, 10300, 9500, 9600, 7100,10100,7200)
shapiro.test(data)

샤피로 테스트 결과 p value 가 0.05 이하이므로 정규분포를 따르지 않음

자료의 대칭성을 확인해보자

par(mfrow=c(1,2))
hist(data);plot( cut(data, breaks = 5))

대칭이 아니므로 Wilcoxon 검정을 수행할 수 없고 부호검정을 수행한다.

부호검정에서 중위수와 같은 관측치는 유효하지 않으므로 제외한다.

 

median(data)
sum(data != 9600)   # (2022-08-03 설명) 표본의 중위수와 같은 값을 제외한 것은 오류. 모수와 같은 값을 제외해야함.

중위수는 9600 이며, 유효한 샘플 즉 9600 을 제외한 샘플수는 9 이다

 

3. 검정통계량 및 연구가설 채택 여부 작성(5)

 

library(BSDA)
SIGN.test(data, md = 10000, alternative = 'less')

p value 0.05보다 크므로 귀무가설을 채택한다. 즉 진공관의 모집단은 1만 시간이다.

 

 

4. 추가로 연구할 내용

대립가설 : 1만 시간이 아니다 vs  1만 시간보다 작다

주어진 데이터가 12개인 경우 정규성 검증을 통해 모수/비모수 검정을 선택하는 것이 맞는가?

wilcoxon 검정의 경우 대칭성을 전제로 한다는데, 대칭성의 판단 방법은 무엇인가?

부호검정 대신 wilcoxon 검정을 수행하는 경우에는 다른 결론(p value 0.05 이하로서 대립가설을 채택)으로 마무리된다. 

library(exactRankTests)
wilcox.exact(data, alternative = 'less', mu = 10000)

wilcox.test(data, alternative = 'less', mu = 10000)

 

 

5. 참고한 자료

 

공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오
1. 연구가설 귀무가설 작성(5)
부호검정은 중위수를 기준으로 검정
귀무가설: 진공관의 모집단은 1만 시간이다.
대립가설: 진공관의 모집단은 1만시간이 아니다.
2. 유효한 샘플의 수를 계산(5)
내가 푼 내용: 부호검정을 통해 신뢰구간을 구하고 신뢰구간내에 포함된 샘플의 수 계산 : 5개
모범답안: 중위수와 동일한 데이터를 제외: 10개​​
3. 검정통계량 및 연구가설 채택 여부 작성(5)
library(BSDA)
SIGN.test
귀무가설 채택

출처 : https://cafe.naver.com/sqlpd/28749

 

 

23회 기출 통계
공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개의 샘플을 뽑았다. 유의수준 5%에서 부호검정 하시오. 

1) 귀무가설, 연구가설 세우기 *(대립가설 = 연구가설)
귀무가설 : 데이터의 중위수는 1만 시간이다.
연구가설 : 데이터의 중위수는 1만 시간이 아니다. 

2) 유효한 데이터의 개수는?
*중위수와 동일한 값들은 순위 부호 검정에서 불필요한 값이다. 
> data <- c(9000, 9500, 10000, 10500, 11000, 10000, 11000, 9500, 10000, 11000)
> median(data)
[1] 10000
> sum(data == 10000)
[1] 3
*10개의 데이터 중 3개가 중위수와 동일한 값이므로 7개의 데이터가 유효하다.

3) 검정통계량 및 연구가설 채택 여부를 작성하라.
>library(exactRankTests)
> wilcox.exact(data, alternative = 'less', mu = 10000)

Exact Wilcoxon signed rank test

data:  data
V = 18.5, p-value = 0.8125
alternative hypothesis: true mu is less than 10000
*검정통계량은 18.5이고, p-value는 0.8125로 0.05보다 크므로 귀무가설을 기각할 수 없다. 따라서 연구가설을 채택할 수 없다. 즉, 데이터의 중위수는 1만 시간으로 볼 수 있다.

출처 : 오픈채팅방

 

 

Performs one- and two-sample Wilcoxon tests on vectors of data; the latter is also known as ‘Mann-Whitney’ test.

 

영어로는 

1. Wilcoxon's rank-sum test
2. Wilcoxon's signed-rank test

1은 독립인 두 집단의 평균이 같은지 비교하는 independent t-test의 비모수 방법입니다.
2는 전-후를 비교하는 것 같이 paired된 자료의 차이의 평균이 0인지 비교하는 paired t-test의 비모수 방법입니다.

1은 두 집단을 섞어 순위를 매기고 다시 분리해 두 집단의 "순위 합"(rank-sum)을 비교합니다. 그래서 rank-sum test라고 하고요. 

2는 paired된 전-후의 차이를 구합니다. 차이가 음수도 있고 양수도 있겠죠. 차이의 순위를 구하는데 절대값의 순위를 구합니다. 그리고 원래 +/- 부호를 붙여줍니다. 순위에 +/- sign을 붙였으니 signed-rank 죠. 그래서 singed-rank test라 부릅니다. 그 signed-rank의 분포의 중위값이 0에 가까운지 검정합니다.

출처 : https://kin.naver.com/qna/detail.naver?d1id=11&dirId=1128&docId=385530013&qb=7JyM7L2V7IqoIOu2gO2YuCDsiJzsnIQg6rKA7KadIHZzIOyInOychO2VqeqygOyglQ==&enc=utf8&section=kin.ext&rank=1&search_sort=0&spq=0 

 

 

Wilcoxon rank-sum test is used to compare two independent samples, while Wilcoxon signed-rank test is used to compare two related samples, matched samples, or to conduct a paired difference test of repeated measurements on a single sample to assess whether their population mean ranks differ. 

출처 : https://www.sciencedirect.com/topics/medicine-and-dentistry/wilcoxon-signed-ranks-test

 

 

참고 자료

 

https://blog.naver.com/jjy0501/222616527304

https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test

https://terms.naver.com/entry.naver?cid=42125&docId=1923991&categoryId=42125

https://www.sciencedirect.com/topics/medicine-and-dentistry/wilcoxon-signed-ranks-test

https://blog.naver.com/plusstar75/222264973397

https://cafe.naver.com/sqlpd/28193

https://blog.naver.com/pmw9440/221435631628

https://youtu.be/5Py1tpC-Eto

https://terms.naver.com/entry.naver?cid=50294&docId=273553&categoryId=50294

 

 

문제 복원에 참고한 자료

 

 

출처 : https://cafe.naver.com/sqlpd/28193

 

 

2. 통계분석

  • 공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오
    • 1. 연구가설 귀무가설 작성(5)
    • 2. 유효한 샘플의 수를 계산(5)
    • 3. 검정통계량 및 연구가설 채택 여부 작성(5)

출처 : https://sosoeasy.tistory.com/558

 

 

출처 : https://billionaire1004.tistory.com/40