ADP (R) 111

[R] factor() vs as.factor()

factor() 와 as.factor() 두 가지가 완전히 동일한 줄 알았습니다. as.factor() 를 사용하다 에러가 뜨는 경우를 만났습니다. 이것을 해결하기 위해 이것 저것 엉뚱한 것들을 시도해보았습니다. factor() 와 as.factor() 와 같은 줄 알고 factor()로는 시도조차 안 해보다가, factor() 로 바꾸면 해결되는 것을 알았을 때 어이가 없었습니다. 인터넷 검색을 해보았는데 나름 정리가 잘된 글을 보았습니다. 그렇다면 R 프로그램에서 범주형 변수를 생성할 수 있는 두 함수, factor와 as.factor의 차이점은 무엇일까? 둘 다 factor를 생성할 수 있고 level을 지정할 수 있다. 그렇지만 as.factor는 원래 factor가 아닌 데이터형을 factor로..

ADP (R) 2022.10.28

ADP 실기 기출 풀이 모음 (~26회)

회차 문제 복기 / Study 진행 상황 / to-do 26 1.머신러닝 전처리 및 군집분석 군집분석 제출 답안 복기 2.군집분석 결과 평가 및 활용 Knn 추천 고객당 여러 줄인데 한줄로 처리 제품별 건수 계산 3.철강제품의 불량률 표본의 크기 4.남학생과 여학생 혈압 차이 검정 t.test vs 계산식으로 직접 풀어보기 5.3개의 선거구별 지지율 검정 chisq.test or porp.test 6.Silver 9개월 가격 시각화 풀이 보완중. x축 표시 변경. 범례표시 7.베이지안 회귀분석 MCMC 인수 설정법. 역감마함수. 예측방법 25 기계1. RFM 군집분석 기계2. 시계열 문제(유입관광객) 문제 생성 및 풀이 시작 sarima 통계1.여러통계문제 갈 때 4km/h로 가고 올 때 5km/h로 왔..

ADP (R) 2022.10.27

[R] 다변량 데이터 상관관계 분석

ADP 실기를 한 차례 겪어보니 처음 접하는 데이터셋의 변수가 많은 경우 빠르고 효율적인 EDA 방법이 필요해보입니다.오늘은 Boston 데이터셋의 상관관계 분석을 for 구문 apply 구문을 이용해서 처리하는 법을 연구해보았습니다. data(Boston,package="MASS") str(Boston) library(PerformanceAnalytics) chart.Correlation(Boston) #1. 가장 원초적인 방법 cor.test(Boston$crim, Boston$medv) cor.test(Boston$zn, Boston$medv) # 타이핑하다 날 샐 것 같습니다. #2. 문자 대신 숫자 # 1번 보다는 빠르지만 오래 걸리기는 마찬가지 cor.test(Boston[,1], Boston..

ADP (R) 2022.10.23

[R] 결측치 처리 방법 (중위수/최빈값)

1. 시험에 나왔습니다 ADP 실기 시험을 보았는데 결측치 처리 문제(https://it-freelancer.tistory.com/293)가 첫 부분에 나왔습니다. 그렇게 어려운 문제가 아니었음에도, 제한 시간 내에 만족스런 답을 제출하지 못하고 허둥댄 것 같습니다. 2. 결론부터 말하자면, 다음에는 이렇게 해야겠습다. # 결측값 확인 library(skimr) library(dplyr) data(Cars93,package="MASS") Cars93 %>% skim() %>% filter(n_missing > 0) # 최빈값 중위수 대치 Cars93

ADP (R) 2022.10.23