9월 25일 26회 실기 시험을 준비하고 있습니다.
22회 다항회귀 문제를 만들어 풀어보았습니다.
1. 문제
다음 script 실행으로 문제에서 사용할 데이터셋 aa를 생성하시오.
library(MASS)
data(Boston)
aa <- Boston[,c(13,6)]
colnames(aa) <- c("x","y")
데이터 : aa, 독립변수 : x, 종속변수 : y
다항 회귀를 3차까지 적용하고 각 차수별 데이터포인트 스캐터 플롯과 회귀선을 그리시오
2. 답안
library(car)
library(dplyr)
#EDA
#초록색 로에스추세선을 보면 2번의 꺾임이 보임
# 3차 다항식 회귀모델이 최상의 모델로 예상됨
scatterplot(y ~ x, data=aa,
pch=19,col="orangered",cex=0.2,
#regLine=list(method=lm,lty=2,lwd=3,col="royalblue"),
smooth=list(smoother=loessLine,spread=FALSE,
lty.smooth=1,lwd.smooth=3,col.smooth="green3"))
# 1차 ~ 3차 다항회귀 모델 생성
lm1 <- lm(y ~ x, data=aa)
lm2 <- lm(y ~ x + I(x^2), data=aa)
lm3 <- lm(y ~ x + I(x^2) + I(x^3), data=aa)
# 차수별 회귀선
plot(y ~ x, data=aa)
lines(sort(aa$x),fitted(lm1)[order(aa$x)],col = "red",type = "l",lwd=2)
lines(sort(aa$x),fitted(lm2)[order(aa$x)],col = "blue",type = "l",lwd=2)
lines(sort(aa$x),fitted(lm3)[order(aa$x)],col = "black",type = "l",lwd=2)
# 모델 평가
summary(lm1)
summary(lm2)
summary(lm3)
3. Study 이력
library(car)
library(dplyr)
# 독립변수와 종속변수의 관계를 시각화하여 EDA
scatterplot(y ~ x, data=aa)
scatterplot(y ~ x, data=aa,
pch=19,col="orangered",cex=0.2,
#regLine=list(method=lm,lty=2,lwd=3,col="royalblue"),
smooth=list(smoother=loessLine,spread=FALSE,
lty.smooth=1,lwd.smooth=3,col.smooth="green3"))
# 초록색 로에스추세선을 보면 2번의 꺾임이 보임
# 3차 다항식 회귀모델이 최상의 모델로 예상됨
lm1 <- lm(y ~ x, data=aa)
lm2 <- lm(y ~ x + I(x^2), data=aa)
lm3 <- lm(y ~ x + I(x^2) + I(x^3), data=aa)
# 단순선형회귀(lm1) > 2차항모델 > 3차항 모델 순으로 높은 성능을 나타냄
# R-squared 증가하며 Residual standard error 감소
summary(lm1)
summary(lm2)
summary(lm3)
lines(arrange(data.frame(aa$x,fitted(lm1)), aa$x), col="cornflowerblue", lwd=2)
lines(arrange(data.frame(aa$x,fitted(lm2)), aa$x), col="cornflowerblue", lwd=2)
lines(arrange(data.frame(aa$x,fitted(lm3)), aa$x), col="black", lwd=2)
4. 문제 복원에 참고한 자료
3. 독립변수 하나 종속변수 하나 소규모 데이터.
다항 회귀를 3차까지 적용하고 각 차수별 데이터포인트 스캐터 플롯과 계수와 기울기 선을 그리라고 함(12점) .
ADP 21회 (출처: https://cafe.naver.com/sqlpd/21090)
3. 다항회귀 그래프 시각화 (12점)
다항회귀를 실시하고 (항의 개수는 3차까지) 각 항 별로 그래프를 그려 코드와 함께 제출
https://mizykk.tistory.com/127[ADP 실기] 20회-21회 데이터분석전문가 실기시험 문제 :: Python
https://9566.tistory.com/55 ADP 실기(제 21회 데이터 분석 전문가)
https://blog.naver.com/ahyong_98/222422550297[자격증] ADP 실기 첫 시험에 합격하기
'ADP (R)' 카테고리의 다른 글
오늘의 ADP 준비 / 2022-08-03 수(D53) (0) | 2022.08.03 |
---|---|
오늘의 ADP 준비 / 2022-08-02 화(D54) (0) | 2022.08.02 |
오늘의 ADP 준비 / 2022-07-31 일(D56) (0) | 2022.07.31 |
Scheffe 사후검정 (0) | 2022.07.31 |
오늘의 ADP 준비 / 2022-07-29 금(D58) (0) | 2022.07.29 |