ADP (R)

IQR 기준 이상치 제거 방법

멋쟁이천재사자 2022. 10. 7. 19:11

IQR 기준의 이상치 제거 방법입니다.

mtcars 데이터의 hp 변수를 대상으로 한 script 입니다.

두 가지 방법으로 작성해보았습니다.

 


# 1. IQR 계산을 통한 이상치 삭제

boxplot(mtcars)
mtcars.hp.q1 <- quantile(mtcars$hp,1/4) #96.5
mtcars.hp.q3 <- quantile(mtcars$hp,3/4)
mtcars.hp.iqr <- quantile(mtcars$hp,3/4) - quantile(mtcars$hp,1/4)

mtcars.hp.min <- mtcars.hp.q1 - 1.5 * mtcars.hp.iqr
mtcars.hp.max <- mtcars.hp.q3 + 1.5 * mtcars.hp.iqr

mtcars.clean <- mtcars[mtcars$hp >= mtcars.hp.min & mtcars$hp <= mtcars.hp.max,]
boxplot(mtcars.clean)


# 2. boxplot 의 out 을 이용한 이상치 삭제

 

mtcars.hp.boxplot <- boxplot(mtcars$hp)
mtcars.clean <- mtcars[mtcars$hp != mtcars.hp.boxplot$out,]
boxplot(mtcars.clean)


par(mfrow = c(1, 2))
boxplot(mtcars$hp);boxplot(mtcars.clean$hp)

 

이상치가 사라진 모습을 확인할 수 있습니다.

 

 

'ADP (R)' 카테고리의 다른 글

[R] 전처리 샘플 airquality  (0) 2022.10.08
[R example] curve  (0) 2022.10.07
ADP 실기 26회 복기  (0) 2022.10.04
[R example] caret::knn3  (0) 2022.09.29
[Adp 실기 기출 풀이] 26회 - 베이지안 회귀분석  (0) 2022.09.27