IQR 기준의 이상치 제거 방법입니다.
mtcars 데이터의 hp 변수를 대상으로 한 script 입니다.
두 가지 방법으로 작성해보았습니다.
# 1. IQR 계산을 통한 이상치 삭제
boxplot(mtcars)
mtcars.hp.q1 <- quantile(mtcars$hp,1/4) #96.5
mtcars.hp.q3 <- quantile(mtcars$hp,3/4)
mtcars.hp.iqr <- quantile(mtcars$hp,3/4) - quantile(mtcars$hp,1/4)
mtcars.hp.min <- mtcars.hp.q1 - 1.5 * mtcars.hp.iqr
mtcars.hp.max <- mtcars.hp.q3 + 1.5 * mtcars.hp.iqr
mtcars.clean <- mtcars[mtcars$hp >= mtcars.hp.min & mtcars$hp <= mtcars.hp.max,]
boxplot(mtcars.clean)
# 2. boxplot 의 out 을 이용한 이상치 삭제
mtcars.hp.boxplot <- boxplot(mtcars$hp)
mtcars.clean <- mtcars[mtcars$hp != mtcars.hp.boxplot$out,]
boxplot(mtcars.clean)
par(mfrow = c(1, 2))
boxplot(mtcars$hp);boxplot(mtcars.clean$hp)
이상치가 사라진 모습을 확인할 수 있습니다.
'ADP (R)' 카테고리의 다른 글
[R] 전처리 샘플 airquality (0) | 2022.10.08 |
---|---|
[R example] curve (0) | 2022.10.07 |
ADP 실기 26회 복기 (0) | 2022.10.04 |
[R example] caret::knn3 (0) | 2022.09.29 |
[Adp 실기 기출 풀이] 26회 - 베이지안 회귀분석 (0) | 2022.09.27 |