[R] x is not a factor 오류 해결 1. 문제 우연성 검정 공부 즉 tseries::runs.test 기능 테스트 중에 발생한 오류입니다. Error in tseries::runs.test(data) : x is not a factor 2. 재현 data runs.test(factor(x)) Error in runs.test(factor(x)) : x does not contain dichotomous data ADP (R) 2022.09.14
R document 에 없는 매개변수? (plot 함수의 hang) R Document 에는 없는데 동작하는 매개변수를 보신 적이 없으신가요? 1. plot(hc, hang = -1) hclust 설명서(?hclust)의 example 에 보면 매개변수 hang 의 차이를 알 수 있습니다. x 축에 글자들 달려있는 모양이 다릅니다. hc plot(iris,hang=-1) There were 50 or more warnings (use warnings() to see the first 50) > warnings() Warning messages: 1: In plot.window(...) : "hang"는 그래픽 매개변수가 아닙니다 2: In plot.xy(xy, type, ...) : "hang"는 그래픽 매개변수가 아닙니다 3: In title(...) : "hang"는.. ADP (R) 2022.09.03
[R] {.->>aa} 이것이 뭐지? dplyr 의 파이프(%>%) 연산자 다음에 와있는 {.->>xx} 도무지 무슨 기호일까요. {} 도 어렵고 . 도 어렵고 ->> 도 어렵습니다. 그래서 연구를 조금 해보았습니다. 1. ->> 와 % {.->>aa} %>% .$Species %>% table() iris %>% head() %>% {bb % table() 2. 쩜(.) 은 또 무엇인가요 다른 거 빼고 달랑 쩜만 찍어보았습니다. > iris %>% head() %>% . Error in .(.) : could not find function "." %>% 다음에는 함수(function)가 와야하는데 "." 은 함수가 아니야~ 라는 의미로 이해되네요 3. {.} {} 둘 다 비슷해보이는데 달랑 "." 만 사용하는 경우 에러가 나서 괄호로 묶.. ADP (R) 2022.09.03
ungroup by_cyl % group_by(cyl) # grouping doesn't change how the data looks (apart from listing # how it's grouped): by_cyl # It changes how it acts with the other dplyr verbs: by_cyl %>% summarise( disp = mean(disp), hp = mean(hp) ) by_cyl %>% filter(disp == max(disp)) # Each call to summarise() removes a layer of grouping by_vs_am % group_by(vs, am) by_vs % summarise(n = n()) by_vs by_vs %>% summarise.. ADP (R) 2022.09.03
20년 간 몰랐던 LTRIM RTRIM 사용법 SQL 이 우리말보다 편한 멋쟁이천재사자입니다. 오늘 오픈채팅방에서 우연히 LTRIM 관련 질문을 보고 깜짝 놀랐습니다. 1. 간단하지만 깜짝 놀란 질문 데이터자격증 관련 오픈 채팅방에서 어떤 분의 질문을 보았습니다. 다음 SQL 의 결과는 ? select RTRIM(LTRIM('SQL DEVELOPER', 'S'), 'SQL') from dual 2. 왜 놀랐냐구요? 오래 전 OCP8i 취득한 이래 SQL과 함께한 세월이 20여년입니다. 그런데 질문에서 보이는 LTRIM RTRIM 사용 구문이 생소합니다. 두 번째 인수를 사용한 문장을 처음 봅니다. 언제부터 제공된 기능이었을까? 3. 관련 질문을 Googling 해보았습니다. 똑같은 질문이 네이버카페에도 올라와 있네요. https://cafe.nave.. SQL 2022.08.30
부호 검정의 유효 표본수 부호 검정(일표본 중위수 검정) 주제로 한 차례 포스팅 (https://it-freelancer.tistory.com/153) 을 했었습니다. 데이터들 중에 위치모수 θ와 같은 데이터가 있는 경우 표본의 크기에서 제외시켜야 한다고 합니다. 1. 위치모수 θ가 무엇일까요? 모집단의 중위수입니다. SIGN.test 이용시에는 유효하지 않은 데이터는 알아서 제외하고 계산을 해줍니다. 그러나 이항분포를 이용하여 직접 계산하는 경우에는 제외하는 작업을 직접 해주어야 합니다. 2. SIGN.test 및 pbinom 결과를 비교 분석해 보겠습니다. # 123, 105, 117, 117,109, 118, 122 의 중위수는 118 이라고 주장하는 경우 부호검정 theta ADP (R) 2022.08.29
T통계량 계산식 t value 를 구하는 주제로 여러 자료를 보았습니다. t 검정의 종류가 다양한 만큼 계산식의 종류와 내용도 복잡하고, 간혹 오류가 있는 자료도 있었습니다. Wikipedia 기준으로 최종 정리했습니다. 1. T 통계량 수식 정리 t 통계량은 평균의 차이를 불확실성 s/sqrt(n) 으로 표준화한 값입니다. 불확실성은 표본분산을 표본수로 나누어 제곱근을 취해서 구합니다. 표본이 두 개인 경우에는 표본분산과 표본수가 2개씩이므로 각각 표본분산을 표본수로 나눈 값을 더해서 처리합니다. 표본이 두 개인데 분산이 동일한 경우 수식이 아주 아주 복잡해지는데, 표본수가 다른 것을 감안해서 합해주는 개념으로 이해하면 그렇게까지 복잡한 것도 아닙니다. * 이분산의 경우 자유도 2. R 에서 확인 표본수나 정규성 등은.. ADP (R) 2022.08.28
오늘의 ADP 준비 / 2022-08-27 토(D29) 지난 5월 21일 25회 ADP 필기를 합격하고, 9월 25일 26회 실기를 준비하고 있습니다. 이제 정말 얼마 남지 않았네요. 1. 기출 문제 풀이 ADP 23회 객실사용여부 캐글에 있는 풀이를 한번 보았는데 꼼꼼히 살펴보고 정리할 필요가 있습니다. 그 동안 통계와 시계열 위주로만 공부하다 보니 기계학습 부분을 소홀히 했어요. 2. 기출 문제 풀이 기출문제 풀이를 업데이트했습니다. [Adp 실기 기출 풀이] 25회 혈압약 Paired t-test 문제 기출 문제 풀이를 위해 t-test 를 공부 (쌍체검정 vs 일표본t검정) 를 했는데 해도 해도 새로운 것이 있네요. n 으로 나눌지 n-1 로 나눌지는 항상 헷갈리는 부분입니다. 3. 기출 문제 풀이 ?chisq.test 에서 Xsq$expected 사.. ADP (R) 2022.08.27
[TIP] 테이블 레이아웃 조회 /* 익숙하지 않은 테이블 레이아웃을 보기 편하게 표시해주는 쿼리입니다. */ SELECT A.OWNER, A.TABLE_NAME, A.COMMENTS TABLE_COMMENTS , B.COLUMN_ID, B.COLUMN_NAME, C.COMMENTS COLUMN_COMMENTS , B.DATA_TYPE||CASE WHEN B.DATA_TYPE = 'TIMESTAMP(6)' THEN '' ELSE '('||CASE WHEN B.DATA_TYPE IN ('NUMBER', 'FLOAT') AND B.DATA_PRECISION IS NOT NULL AND NVL(B.DATA_SCALE, 0) 0 THEN TO_CHAR(B.DATA_PRECISION)||','||TO_CHAR(B.DATA_SCALE) WHEN .. SQL 2022.08.23