[R] use column names for `x` 오류 해결 오류 Error: Please use column names for `x` 발생 caret::train 을 이용하여 knn 알고리즘으로 훈련을 시도하다가 발생 재현 library(caret) library(dplyr) airquality %>% select(Solar.R,Temp ) %>% mutate(n=row_number()) %>% filter(!is.na(Solar.R)) -> train knnFit1 ADP (R) 2022.11.15
[R] length of 'dimnames' [2] not equal to array extent 오류 length of 'dimnames' [2] not equal to array extent 발생 베이즈회귀(bayesreg) 모델을 통해 예측을 시도(predict)하는 과정에서 발생 재현 library(car) library(bayesreg) m ADP (R) 2022.10.30
[R]`data` and `reference` should be factors... 오류 # Error: `data` and `reference` should be factors with the same levels. 발생 분류 분석 이후 caret::confusionMatrix 를 이용하여 성능을 평가하려고 시도하다가 발생 재현 library(caret) mtcars.glm ADP (R) 2022.10.30
[R] factor() vs as.factor() factor() 와 as.factor() 두 가지가 완전히 동일한 줄 알았습니다. as.factor() 를 사용하다 에러가 뜨는 경우를 만났습니다. 이것을 해결하기 위해 이것 저것 엉뚱한 것들을 시도해보았습니다. factor() 와 as.factor() 와 같은 줄 알고 factor()로는 시도조차 안 해보다가, factor() 로 바꾸면 해결되는 것을 알았을 때 어이가 없었습니다. 인터넷 검색을 해보았는데 나름 정리가 잘된 글을 보았습니다. 그렇다면 R 프로그램에서 범주형 변수를 생성할 수 있는 두 함수, factor와 as.factor의 차이점은 무엇일까? 둘 다 factor를 생성할 수 있고 level을 지정할 수 있다. 그렇지만 as.factor는 원래 factor가 아닌 데이터형을 factor로.. ADP (R) 2022.10.28
[Adp 실기 기출 풀이] 25회 평균 계산 문제 1. 문제 반올림하여 소수점 두째자리로 표시하시오 1-1. 갈 때 4km/h로 가고 올 때 5km/h로 왔다면 왕복 평균 속도는? 1-2. 연매출이 3000, 4000, 5000이었다면 연평균 몇 배가 증가한 것인가? 2. 답안 1-1 왕복평균속도는 4.4km/h round(2 * (4*5) / (4+5),2) 1-2. 연평균 성장률은 1.29 # 3000 * x^2 = 5000 round((5000 / 3000) ^ (1/2), 2) ADP (R) 2022.10.27
ADP 실기 기출 풀이 모음 (~26회) 회차 문제 복기 / Study 진행 상황 / to-do 26 1.머신러닝 전처리 및 군집분석 군집분석 제출 답안 복기 2.군집분석 결과 평가 및 활용 Knn 추천 고객당 여러 줄인데 한줄로 처리 제품별 건수 계산 3.철강제품의 불량률 표본의 크기 4.남학생과 여학생 혈압 차이 검정 t.test vs 계산식으로 직접 풀어보기 5.3개의 선거구별 지지율 검정 chisq.test or porp.test 6.Silver 9개월 가격 시각화 풀이 보완중. x축 표시 변경. 범례표시 7.베이지안 회귀분석 MCMC 인수 설정법. 역감마함수. 예측방법 25 기계1. RFM 군집분석 기계2. 시계열 문제(유입관광객) 문제 생성 및 풀이 시작 sarima 통계1.여러통계문제 갈 때 4km/h로 가고 올 때 5km/h로 왔.. ADP (R) 2022.10.27
[R] 로지스틱 회귀 연습 (with mtcars) #이항 로지스틱 회귀 분석 : 예측 결과가 0,1 이 아님 # 1-1. 종속변수 am 와 나머지 독립변수에 로지스틱 회귀 분석 rm(list=ls()) # 상관성 낮아 보임 carb vs qsec hp library(PerformanceAnalytics) chart.Correlation(mtcars, histogram=TRUE, pch="+") sum(is.na(mtcars)) str(mtcars) # Warning messages: # 1: glm.fit: 알고리즘이 수렴하지 않았습니다 mtcars.glm ADP (R) 2022.10.26
[R] 다변량 데이터 상관관계 분석 ADP 실기를 한 차례 겪어보니 처음 접하는 데이터셋의 변수가 많은 경우 빠르고 효율적인 EDA 방법이 필요해보입니다.오늘은 Boston 데이터셋의 상관관계 분석을 for 구문 apply 구문을 이용해서 처리하는 법을 연구해보았습니다. data(Boston,package="MASS") str(Boston) library(PerformanceAnalytics) chart.Correlation(Boston) #1. 가장 원초적인 방법 cor.test(Boston$crim, Boston$medv) cor.test(Boston$zn, Boston$medv) # 타이핑하다 날 샐 것 같습니다. #2. 문자 대신 숫자 # 1번 보다는 빠르지만 오래 걸리기는 마찬가지 cor.test(Boston[,1], Boston.. ADP (R) 2022.10.23
[R] 결측치 처리 방법 (중위수/최빈값) 1. 시험에 나왔습니다 ADP 실기 시험을 보았는데 결측치 처리 문제(https://it-freelancer.tistory.com/293)가 첫 부분에 나왔습니다. 그렇게 어려운 문제가 아니었음에도, 제한 시간 내에 만족스런 답을 제출하지 못하고 허둥댄 것 같습니다. 2. 결론부터 말하자면, 다음에는 이렇게 해야겠습다. # 결측값 확인 library(skimr) library(dplyr) data(Cars93,package="MASS") Cars93 %>% skim() %>% filter(n_missing > 0) # 최빈값 중위수 대치 Cars93 ADP (R) 2022.10.23
[R] kernlab class probability calculations failed 1. 발생 분류문제를 randomForest 와 svm 두 가지 방식으로 예측하여 비교해보는 중이었습니다. ROC Auc 지표로 비교하기 위해 확률값으로 결과를 예측하는 과정에서 svm 모델에서 오류가 발생하였습니다. library(caret) library(recipes) library(dplyr) set.seed(2022) train ADP (R) 2022.10.23