ADP (R)

[Adp 실기 기출 풀이] 24회 두 제품의 평균이 차이가 있는지

멋쟁이천재사자 2022. 8. 19. 22:46

9월 25일 26회 시험을 준비하고 있습니다.

후기에서 확인한 정보를 이용해서 기출 문제를 만들어 풀어보고 있습니다.

 

문제

A생산라인, B생산라인 각각에서 12개의 제품을 샘플로 뽑았다.

A생산라인의 제품 평균은 5.7mm이고 표준편차는 0.03, B생산라인의 제품 평균은 5.6mm이고 표준편차는 0.04 이다.

 

5%유의수준에서 두 제품의 평균의 차이가 있는지 검정하라

 

1. 귀무가설과 대립가설을 작성하시오
2. 검정통계량 구하고 대립가설 채택여부를 작성하시오 

 

답안

 

1. 귀무가설과 대립가설을 작성하시오

 

귀무가설 : A,B 두 생산라인 제품의 평균은 같다.

대립가설 : A,B 두 생산라인 제품의 평균은 같지 않다.


2. 검정통계량 구하고 대립가설 채택여부를 작성하시오 

 

두집단의 표본수가 동일(표본의 표준편차가 2개 이내임)하므로 등분산 가정 T검정을 수행한다.

t 통계량 6.928203 에 대한 p-value 4.052937e-05 는 0.05 보다 작으므로 귀무가설을 기각한다.

 

MD <- 5.7 - 5.6                                              # 평균차이
SPN <- (n1 - 1) * var1 + (n2 - 1) * var2         # Pooled Variance 분모
SPD <- (n1 - 1) + (n2 - 1)                              # Pooled Variance 분자                  
MD / (sqrt(SPN / SPD) * sqrt(1/n1 + 1/n2) )  # t 통계량
pt(6.928203,df=10,lower.tail = F) * 2

 

 

참고

표본수가 동일한 경우에는 등분산 가정 T검정을 한다고 하는 자료가 있습니다.

 

출처 : https://www.investopedia.com/terms/t/t-test.asp

 

 

Wikipedia 에서는 표준편차의 차이가 2개 이내이면 등분산이라고 합니다.

 

출처: https://en.wikipedia.org/wiki/Student%27s_t-test

T통계량 계산식에 정리한 T값 수식을 이용하여 p-value 를 구했습니다.

재구성 문제는 실제 기출과는 차이가 있을 수 있으며, 실제 문제는 z분포를 이용해서 풀어야 하는 문제였을지도 모르겠습니다. 

 

 

문제 복원 관련 자료

A생산라인의 제품 평균은 5.7mm이고 표준편차는 0.03, B생산라인의 제품 평균은 5.6mm이고 표준편차는 0.04라면 5%유의수준으로 두 제품의 평균이 차이가 있는지 여부를 검정하기 (Z통계량도 제공 - Z(0.05) = 1.65, 위의 구체적인 숫자는 실제 시험 때 숫자랑 정확하게 맞지는 않음)
귀무가설과 대립가설 세우기
두 평균이 차이가 있는지 검정 하기 

출처: https://lovelydiary.tistory.com/381



2. 두 생산라인 차이가 있는지 평가해라(데이터로 주어진게 아니라, 두 생산라인의 평균값과 표준편차가 주어졌습니다)
2.1 귀무가설과 대립가설을 써라
* 귀무가설 : 차이가 없다 대립가설 : 차이가 있다.
* 문제에서 요구한 것은 양측검정인데, 문제에 주어진 z 임계값은 단측검정 값으로 주어져서 단측검정을 써야하나 싶었지만 양측검정이 맞다고 생각해서 양측검정으로 풀었습니다.
2.2 신뢰구간을 구해라
* 주어진 평균값과 표준편차를 통해 식에 대입해서 풀었습니다.

출처: https://cafe.naver.com/sqlpd/33076

 

 

 

2. A생산라인, B생산라인  각각에서 12개의 제품의 A 평균, 시그마제곱 / B 평균, 시그마제곱 값 제시
A, B에서 뽑은 12개의 샘플이 정규분포를 따를 때 두 생산라인이 비슷한 성능을 가지는지 검정
제일 아쉬운 문제다.....
처음에는 평균/시그마제곱 주어져서 어쩌라구?? 했는데
곰곰히 생각해보니 uniform(뮤=평균, 시그마=시그마, n=12)로 12개의 정규분포 sample을 추출해서
A 12개 샘플, B 12개 샘플을 DataFrame으로 만들어 독립 표본 t.test를 하는 문제인 것 같았다.
허허 나의 문제는 R에서는 정규분포에서 sample추출하는 코드는 알고 있었지만 Python에서는 몰랐다는 것,,,,,
그래서 급하게 help(np.random)으로 검색을 해보았지만 결국 찾아내지 못했다,,,,,,
np.random.lognormal이었나? 머 그런거로 대충 sample을 만들고 '내가 sample을 잘 못 만든거 안다.
내가 코드를 모른다. 대신 이 데이터로 t.test할테니 부분점수를 받기 희망한다' 이렇게 답안을 작성했다
휴 !!!!!!!!!!!!!!!!!!!

출처: https://blog.naver.com/leeys216/222685525349

 

출처 : https://stherhj.tistory.com/162

...

 

출처 : https://cafe.naver.com/sqlpd/35446