ADP (R)

[Adp 실기 기출 풀이] 26회 - 남학생과 여학생 혈압 차이 검정

멋쟁이천재사자 2022. 9. 27. 00:29

지난 5월 21일 25회 ADP 필기를 합격했고, 9월 25일 첫 번째 실기를 보았습니다.
필기 유예 기간 끝날 때까지 도전할 계획이며, 11월 26일 27회 실기를 준비하고 있습니다.
제 기억과 다른 후기에서 확인한 정보를 이용해서 기출 문제를 재구성하여 풀어보려고 합니다.

 

1. 문제

4. 다음 스크립트를 실행하여 샘플 데이터 x 를 생성하라. (실제 문제는 blood_pressure.csv 의 혈압정보를 이용하라)

주어진 데이터는 남여 혈압 데이터로서 두집단은 정규분포를 따르며 분산이 동일하다고 가정한다.

남녀 간에 혈압의 차이가 있는지 검정하라 

 

x <- rbind(data.frame(M=120,F=114),
      data.frame(M=124,F=89),
      data.frame(M=130,F=116),
      data.frame(M=112,F=129),
      data.frame(M=118,F=111),
      data.frame(M=125,F=125),
      data.frame(M=127,F=114),
      data.frame(M=119,F=90),
      data.frame(M=109,F=102),
      data.frame(M=120,F=NA),
      data.frame(M=128,F=NA),
      data.frame(M=120,F=NA),
      data.frame(M=122,F=NA),
      data.frame(M=115,F=NA))

 

4-1. 귀무가설과 연구가설을 설정하라
4-2. 소수점 2자리 반올림하여 95% 신뢰구간을 구하라. 

연구가설 채택여부를 결정하고, 신뢰구간이 연구가설 채택에 어떤 역할을 하는지 설명하라. (t0.02521=2.08)

 

2. 제출 답안

 

4-1. 가설 설정

귀무가설 : 남녀 간에 혈압의 차이는 없다.

연구가설 : 남녀 간에 혈압의 차이는 있다.


4-2.

두 집단간 차이의 95% 신뢰구간은 1.91 ~ 19.37 임. 

0 이 신뢰구간에 포함되지 않으므로 귀무가설을 기각하고 연구가설을 채택함. 

 

3. 시험후기

제시된 샘플데이터에 대한 자유도와 유의수준에 해당하는 t값이 주어짐.
문제에서 상수를 제공해주면 그 값을 써야할 것 같습니다.

R에서 제공하는 t-test 함수 대신에 일일이 손으로 푸는 것이 정답일지도 모릅니다.
손으로 풀면 시간이 오래 걸릴 것 같아 일단 t-test 로 풀었고, 손으로 하나 하나 풀어볼 여유는 생기지 않았습니다.

계산식에 의해 일일이 풀고 t.test 로 검증해봐야겠습니다.(t 값 소수점 차이로 미세한 차이가 발생할 수 있습니다.)

 

등분산을 가정한다고 문제에서 주어져서 등분산 테스트는 따로 하지 않았습니다.

 

정규성 검정은 하지 않았습니다.

문제에서 등분산은 가정한다고 명시되어 있었는데 정규성에 대한 언급이 있었는지는 기억나지 않습니다. 

t 값이 주어져서 당연히 t.test 하면 되는것으로 생각했습니다.
shapiro.test 등으로 정규성 검정을 하더라도, 남여 각각에 대해서 할지, 아니면 두 그룹을 하나로 묶어서 해야하는지 공부가 필요합니다.

 

남여 그룹의 표본수가 다른 것도 생소합니다. NA 가 있는 상태 그대로 t-test 함수 돌려도 괜찮을까요?

 

4. Study

t.test(x$M,x$F,var.equal = T)

?qt
qt(.975, df = c(1:10,20,50,100,1000))
qt(.975, df = 21)

shapiro.test(x$M)
shapiro.test(x$F)

 

5. 문제 복원 관련 자료

1. dmz04님 블로그

출처 : https://blog.naver.com/dmz04/222884288542

 

2. 꿈꾸는 행동가님 블로그

출처 : https://blog.naver.com/sbp3636/222883834316