ADP (R)

부호 검정의 유효 표본수

멋쟁이천재사자 2022. 8. 29. 15:08

부호 검정(일표본 중위수 검정) 주제로 한 차례 포스팅 (https://it-freelancer.tistory.com/153) 을 했었습니다.

데이터들 중에 위치모수 θ와 같은 데이터가 있는 경우 표본의 크기에서 제외시켜야 한다고 합니다.

 

1. 위치모수 θ가 무엇일까요?

모집단의 중위수입니다.

SIGN.test 이용시에는 유효하지 않은 데이터는 알아서 제외하고 계산을 해줍니다.

그러나 이항분포를 이용하여 직접 계산하는 경우에는 제외하는 작업을 직접 해주어야 합니다.

 

2. SIGN.test 및 pbinom 결과를 비교 분석해 보겠습니다.

 

# 123, 105, 117, 117,109, 118, 122 의 중위수는 118 이라고 주장하는 경우 부호검정
theta <- 118
data <- c(123, 105, 117, 117,109, 118, 122)

# 부호검정
library(BSDA)
SIGN.test(data, md=theta, alternative = "two.sided")

# 이항분포를 이용한 검정
S <- sum(data > theta)    # theta 보다 큰 갯수
n <- sum(data != theta)    # n : theta 가 아닌 갯수. 즉 유효한 샘플수
s <- min(n-S,S)                 # s : + - 중 작은 부호의 갯수
pbinom(s, n, 0.5, lower.tail = TRUE) * 2   # n 개중에 s 개를 뽀는 이항분포 확률

두 결과가 0.6875 로 동일하게 나옵니다.

 

3. n 을 구할 때 median(data)를 제외해주는 것이 아닙니다.

표본의 중위수를 표본의 크기에서 제외하고 계산을 해보면 엉뚱한 결과가 나옵니다.

n <- sum(data != median(data))    # n : 표본의 중위수를 제외한 샘플수(유효한 샘플수 오계산)
s <- min(n-S,S)                 # s : + - 중 작은 부호의 갯수
pbinom(s, n, 0.5, lower.tail = TRUE) * 2   # n 개중에 s 개를 뽀는 이항분포 확률

 

 

 

4. 참고한 자료

 

https://blog.naver.com/pmw9440/221435631628

https://blog.naver.com/pmw9440/221934756608

 

'ADP (R)' 카테고리의 다른 글

[R] {.->>aa} 이것이 뭐지?  (0) 2022.09.03
ungroup  (0) 2022.09.03
T통계량 계산식  (0) 2022.08.28
쌍체검정 vs 일표본t검정  (0) 2022.08.27
오늘의 ADP 준비 / 2022-08-27 토(D29)  (0) 2022.08.27