ADP (R)

[Adp 실기 기출 풀이] 22회 구매패턴 연관성

멋쟁이천재사자 2022. 9. 14. 15:14

9월 25일 26회 실기 시험을 준비하고 있습니다.

22회 기출 문제 중 구매패턴 연관성 문제를 풀어보았습니다.

 

1. 문제

상품 a와 b의 구매 패턴이 aa bb aaaa bbbb a b aa bb aa bbb aa bb a b 로 나타날 때 두 상품의 연관성 유무를 검정하라

 

2. 풀이

H_0 : 연속적인 관측값이 임의적이다.
H_1 : 연속적인 관측값이 임의적이 아니다​.

 

> data <- c('a','a', 'b','b', 'a','a','a','a', 'b','b','b','b', 'a', 'b', 'a','a', 'b','b', 'a','a', 'b','b','b', 'a','a', 'b','b', 'a', 'b')

> tseries::runs.test(as.factor(data))

 

Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 

Runs Test

data:  as.factor(data)
Standard Normal = -0.56148, p-value = 0.5745
alternative hypothesis: two.sided

 

p-value 가 유의수준 5% 에서 유의하지 않다. 

귀무가설을 채택하며 연속적인 관측값은 임의적이다. 즉 두 상품의 연관성은 없다.

 

 

** 직접 계산하여 검정하기

 

#a:a갯수  b: b갯수  runs : 런갯수

a = 14 ; b = 15; runs=14
mu <- ((2 * a * b) / (a + b)) + 1
var <- (2*a*b*(2*a*b - a - b)) / {(a + b)^2 * (a + b - 1)}
#mu ; sqrt(var)

z <- ((runs-mu)/sqrt(var))
pnorm(q=z)*2

[1] 0.5744702

 

3. to-do

DescTools 패키지를 이용하면 결과가 조금 다릅니다. 그 이유는 아직 모릅니다.

 

> DescTools::RunsTest(data)

Runs Test for Randomness

data:  data
runs = 14, m = 14, n = 15, p-value = 0.7058
alternative hypothesis: true number of runs is not equal the expected number

 

 

4. 참고한 자료

https://blog.naver.com/li0224il/220722414973

 

'ADP (R)' 카테고리의 다른 글

[R] plot type="b"  (2) 2022.09.19
머신러닝 (elasticnet svm rf)  (0) 2022.09.14
[R] x is not a factor 오류 해결  (0) 2022.09.14
R document 에 없는 매개변수? (plot 함수의 hang)  (0) 2022.09.03
[R] {.->>aa} 이것이 뭐지?  (0) 2022.09.03