분류 전체보기 458

[R 연습 문제] tapply 코드를 purrr::map 으로 변환하기

1. 문제 chickwts 데이터를 feed 별로 weight 의 합을 tapply 함수를 이용하여 다음과 같이 구할 수 있다. > tapply(chickwts$weight,chickwts$feed,sum) casein horsebean linseed meatmeal soybean sunflower 3883 1602 2625 3046 3450 3947 tapply 함수 대신 split 함수와 purrr 패키지의 map_* 함수를 이용하여 동일한 결과를 구하라 2. 정답 library(purrr) chickwts %>% split(.$feed) %>% map_df(~sum(.$weight)) 3.시행 착오 purrr 을 이용해야 진정한 R 사용자 ! 라고 하여 연습하였습니다. ?map 을 통해 설명서를 보..

ADP (R) 2022.07.20

오늘의 ADP 준비 / 2022-07-19 화(D68)

D-day : 제26회 데이터분석 전문가(실기) 9월 25일 일요일 to-do ---------------------------------- No 구분 todo 기타 1 머신러닝 EDA 계획 - 수치 범주형 모델별 비교 기출문제 2 통계 모수 비모수 검정 기출문제 3 시계열 acf pacf 개념 잡기 기출문제 magrittr done ---------------------------------- ?pacman::p_load 일독 to-do 정리 시작 ymd(20220925) - today() Time difference of 68 days barplot study https://youtu.be/ZPw2zzLXLrQ ?barplot barplot(cbind(Employed, Unemployed) ~ Yea..

ADP (R) 2022.07.19

부서별 평균 월급보다 높은 월급의 사원 목록 구하기

질문 ※ emp 테이블 정보가 당장 없어 union all 을 이용해서 가상의 emp 테이블 생성했습니다. with emp as ( select 'Jane' ename, 1 as deptno, 100 as sal from dual union all select 'Shawn' ename, 1 as deptno, 200 as sal from dual union all select 'Ted' ename, 1 as deptno, 250 as sal from dual union all select 'steve' ename, 2 as deptno, 700 as sal from dual union all select 'John' ename, 2 as deptno, 600 as sal from dual ) select..

SQL 2022.07.19

[ADP 실기 study log] ADP 23회 객실사용여부 (풀이중)

1. 문제 온,습도,조도,CO2농도에 따른 객실의 사용유무 판별 종속변수 Occupancy, 0: 비어있음 , 1: 사용중 데이터 경로 : /kaggle/input/adp-kr-p1/problem1.csv 1 - (1) 데이터 EDA 수행 후, 분석가 입장에서 의미있는 탐색 1 - (2) 결측치를 대체하는 방식 선택하고 근거제시, 대체 수행 1 - (3) 추가적으로 데이터 질을 향상시킬만한 내용 작성(구현 안하고 설명만해도 됨) 2 - (1) 데이터에 불균형이 있는지 확인, 불균형 판단 근거 작성 2 - (2) 오버샘플링 방법들 중 2개 선택하고 장단점 등 선정 이유 제시 2 - (3) 오버샘플링 수행 및 결과, 잘 되었다는 것을 판단해라 3 - (1) 속도측면, 정확도측면 모델 1개씩 선택, 선택 이유..

ADP (R) 2022.07.15

빅분기 작업형 1유형 연습 문제[R]

빅분기 실기 1유형을 R 로 연습한 문제와 답안입니다. DataManim 싸이트 문제를 groom 에서 연습할수 있는 R 기본데이터로 변형하여 풀어보았습니다. 참고싸이트: https://www.datamanim.com/dataset/practice/q1.html 시험전에는 print(a) 방식으로 연습하였으나, 4회 실기시험 지시사항에 따라 cat(a) 로 작성하였습니다. 문제 1. airquality 데이터의 Ozone 수치를 10 단위로 변환 했을 때, 가장 많은 건수를 가진 구간은? (0~9 : 0 , 10~19 : 10,,,) library(dplyr) airquality %>% mutate(gugan=Ozone%/%10*10) %>% group_by(gugan) %>% summarize(cnt=..

빅분기 2022.07.15

Oracle 컬럼 자료형 NUMBER(3,2) 의미는?

1. 질문 오라클 데이터베이스에서 테이블 설계 시 컬럼의 자료형을 NUMBER(3,2)이라고 선언했을 시, 어떤 데이터가 올 수 있는 지 이게 무슨소리인지 이해가안가요 ㅠㅠ 2. 답변 NUMBER(3,2) 는 precision 3 scale 2 로서 소수점아래 2자리를 갖는 3자리 즉 0.00 패턴의 값을 의미합니다. 3. 테스트 select CAST(1.234 AS NUMBER(3,2)) AS tt from dual; -- 1.23 select CAST(1.235 AS NUMBER(3,2)) AS tt from dual;-- 1.24 select CAST(10 AS NUMBER(3,2)) AS tt from dual; -- ORA-01438: 이 열에 대해 지정된 전체 자릿수보다 큰 값이 허용됩니다. ..

SQL 2022.07.14

[ADP 실기 study log] ADP 23회 코로나 시계열 데이터

1. 문제 ADP 23회 (출처1:https://cafe.naver.com/sqlpd/28193) 출처2 : https://www.kaggle.com/code/kukuroo3/problem-r-base?scriptVersionId=87642636 코로나 시계열 데이터 5만 관측치 가량, 날짜, 코로나 누적확진자 등 변수 3개 1. ACF 사용해서 distance 계산 (10) 2 계층적 군집 분석을 위해 덴드로그램 작성 (10) 2. 답안 1. ACF 사용해서 distance 계산 (10) rm(list=ls()) pacman::p_load(tidyverse,magrittr,lubridate,reshape2,recipes,forecast, factoextra, dtw) library(TSdist) tem..

ADP (R) 2022.07.14

멈추면 비로소 보이는 것들

인간 관계는 난로처럼 대해야합니다. 너무 가깝지도, 너무 멀지도 않게. - 혜민 스님 - 풀소유 논란으로 인해 그 가치가 훼손되었지만, 정말 마음에 와 닿았던 부분이고 지금도 항상 되새기곤 합니다. https://blog.naver.com/farmzoo/222573693086 무소유 vs 풀소유 [Feat. 혜민스님] 1년이 지난 해묵은 떡밥이지만, 혜민스님이 논란거리가 된 적이 있다. 혜민 스님이 논란으로 인해 활동을 ... blog.naver.com

카테고리 없음 2022.07.13

floor vs trunc

소수를 정수로 처리하는 경우 반올림을 주로 하지만, 가끔은 절사나 올림 내림 처리도 하지요. 3.14 를 3으로 변환하는 방법은 무엇까요? 두가지 방법이 가능하겠습니다. floor(3.14) 또는 trunc(3.14) 입니다. 저는 내림은 floor 로 하고 절사는 trunc 처리를 하면서도, 막연하게는 두 개들 동일시 해왔던 것 갔습니다. 얼마전 문득 결과가 항상 동일하다면 두개가 있을 이유가 없을 터이고, 두개의 차이가 무엇일까 궁금해졌습니다. 그래서 Oracle SQL Language Reference 를 좀더 꼼꼼히 확인해 보았습니다. FLOOR (oracle.com) FLOOR FLOOR Syntax Description of the illustration ''floor.gif'' Purpose..

SQL 2022.07.13