9월 25일 26회 실기 시험을 준비하고 있습니다.
22회 기출 문제 중 구매패턴 연관성 문제를 풀어보았습니다.
1. 문제
상품 a와 b의 구매 패턴이 aa bb aaaa bbbb a b aa bb aa bbb aa bb a b 로 나타날 때 두 상품의 연관성 유무를 검정하라
2. 풀이
H_0 : 연속적인 관측값이 임의적이다.
H_1 : 연속적인 관측값이 임의적이 아니다.
> data <- c('a','a', 'b','b', 'a','a','a','a', 'b','b','b','b', 'a', 'b', 'a','a', 'b','b', 'a','a', 'b','b','b', 'a','a', 'b','b', 'a', 'b')
> tseries::runs.test(as.factor(data))
Registered S3 method overwritten by 'quantmod':
method from
as.zoo.data.frame zoo
Runs Test
data: as.factor(data)
Standard Normal = -0.56148, p-value = 0.5745
alternative hypothesis: two.sided
p-value 가 유의수준 5% 에서 유의하지 않다.
귀무가설을 채택하며 연속적인 관측값은 임의적이다. 즉 두 상품의 연관성은 없다.
** 직접 계산하여 검정하기
#a:a갯수 b: b갯수 runs : 런갯수
a = 14 ; b = 15; runs=14
mu <- ((2 * a * b) / (a + b)) + 1
var <- (2*a*b*(2*a*b - a - b)) / {(a + b)^2 * (a + b - 1)}
#mu ; sqrt(var)
z <- ((runs-mu)/sqrt(var))
pnorm(q=z)*2
[1] 0.5744702
3. to-do
DescTools 패키지를 이용하면 결과가 조금 다릅니다. 그 이유는 아직 모릅니다.
> DescTools::RunsTest(data)
Runs Test for Randomness
data: data
runs = 14, m = 14, n = 15, p-value = 0.7058
alternative hypothesis: true number of runs is not equal the expected number
4. 참고한 자료
https://blog.naver.com/li0224il/220722414973
'ADP (R)' 카테고리의 다른 글
[R] plot type="b" (2) | 2022.09.19 |
---|---|
머신러닝 (elasticnet svm rf) (0) | 2022.09.14 |
[R] x is not a factor 오류 해결 (0) | 2022.09.14 |
R document 에 없는 매개변수? (plot 함수의 hang) (0) | 2022.09.03 |
[R] {.->>aa} 이것이 뭐지? (0) | 2022.09.03 |