ADP (R)

[Adp 실기 기출 풀이] 22회 다항회귀 3차까지

멋쟁이천재사자 2022. 8. 2. 09:16

9월 25일 26회 실기 시험을 준비하고 있습니다.
22회 다항회귀 문제를 만들어 풀어보았습니다.

 

1. 문제

다음  script 실행으로 문제에서 사용할 데이터셋 aa를 생성하시오.

library(MASS)
data(Boston)
aa <- Boston[,c(13,6)]
colnames(aa) <- c("x","y")

데이터 : aa,  독립변수 : x, 종속변수 : y

다항 회귀를 3차까지 적용하고 각 차수별 데이터포인트 스캐터 플롯과 회귀선을 그리시오

 

2. 답안

library(car) 

library(dplyr)

 

#EDA

#초록색 로에스추세선을 보면 2번의 꺾임이 보임
# 3차 다항식 회귀모델이 최상의 모델로 예상됨
scatterplot(y ~ x, data=aa,
            pch=19,col="orangered",cex=0.2,
            #regLine=list(method=lm,lty=2,lwd=3,col="royalblue"),
            smooth=list(smoother=loessLine,spread=FALSE,
                        lty.smooth=1,lwd.smooth=3,col.smooth="green3"))

 

# 1차 ~ 3차 다항회귀 모델 생성
lm1 <- lm(y ~ x, data=aa) 
lm2 <- lm(y ~ x + I(x^2), data=aa) 
lm3 <- lm(y ~ x + I(x^2) + I(x^3), data=aa) 

 

# 차수별 회귀선
plot(y ~ x, data=aa)                   
lines(sort(aa$x),fitted(lm1)[order(aa$x)],col = "red",type = "l",lwd=2)
lines(sort(aa$x),fitted(lm2)[order(aa$x)],col = "blue",type = "l",lwd=2)
lines(sort(aa$x),fitted(lm3)[order(aa$x)],col = "black",type = "l",lwd=2)

 

# 모델 평가
summary(lm1) 
summary(lm2) 
summary(lm3) 

 

 

3. Study 이력

library(car)
library(dplyr)
# 독립변수와 종속변수의 관계를 시각화하여 EDA

scatterplot(y ~ x, data=aa)
scatterplot(y ~ x, data=aa,
            pch=19,col="orangered",cex=0.2,
            #regLine=list(method=lm,lty=2,lwd=3,col="royalblue"),
            smooth=list(smoother=loessLine,spread=FALSE,
                        lty.smooth=1,lwd.smooth=3,col.smooth="green3"))

 

# 초록색 로에스추세선을 보면 2번의 꺾임이 보임
# 3차 다항식 회귀모델이 최상의 모델로 예상됨

 

lm1 <- lm(y ~ x, data=aa)
lm2 <- lm(y ~ x + I(x^2), data=aa)
lm3 <- lm(y ~ x + I(x^2) + I(x^3), data=aa)

# 단순선형회귀(lm1) > 2차항모델 > 3차항 모델 순으로 높은 성능을 나타냄
# R-squared 증가하며 Residual standard error 감소
summary(lm1)
summary(lm2)
summary(lm3)

lines(arrange(data.frame(aa$x,fitted(lm1)), aa$x), col="cornflowerblue", lwd=2)
lines(arrange(data.frame(aa$x,fitted(lm2)), aa$x), col="cornflowerblue", lwd=2)
lines(arrange(data.frame(aa$x,fitted(lm3)), aa$x), col="black", lwd=2)

 

4. 문제 복원에 참고한 자료

3. 독립변수 하나 종속변수 하나 소규모 데이터.
다항 회귀를 3차까지 적용하고 각 차수별 데이터포인트 스캐터 플롯과 계수와 기울기 선을 그리라고 함(12점) . 
ADP 21회 (출처: https://cafe.naver.com/sqlpd/21090)
3. 다항회귀 그래프 시각화 (12점)
다항회귀를 실시하고 (항의 개수는 3차까지) 각 항 별로 그래프를 그려 코드와 함께 제출
https://mizykk.tistory.com/127[ADP 실기] 20회-21회 데이터분석전문가 실기시험 문제 :: Python
https://9566.tistory.com/55 ADP 실기(제 21회 데이터 분석 전문가)
https://blog.naver.com/ahyong_98/222422550297[자격증] ADP 실기 첫 시험에 합격하기