ADP (R) 111

[Adp 실기 기출 풀이] 25회 3-3 조건부 확률 문제

9월 25일 26회 실기 시험을 준비(https://it-freelancer.tistory.com/130)하고 있습니다. 25회 기출 문제 중 조건부 확률 문제를 풀어보았습니다. 1. 문제 출처 : https://lovelydiary.tistory.com/381 남성, 여성의 등산, 수영에 대한 취미 선호도 빈도표(2x2)를 보고, 남성 중에서 등산을 좋아할 확률을 구하시오 등산 수영 남성 20 10 여성 15 30 2. 답안 20 / (20+10) = 2/3 (단순한 답변 이외에 추가 설명을 해야할 것만 같아 적어보면...) 남성은 20 + 10 = 30 명인데, 그중 등산을 좋아하는 사람은 20명이므로 확률은 20/30 이다. 또한 조건부 확률 P(등산l남자) 는 P(등산 and 남자)/P(남자) 로..

ADP (R) 2022.07.26

오늘의 ADP 준비 / 2022-07-26 화(D61)

1. 조건부 확률 복습 https://youtu.be/r983fovYi_Q https://it-freelancer.tistory.com/45 [ADP] 조건부 확률 연습 문제 모음 문제1 새로 이사 온 옆집 아주머니가 딸과 함께 나오는 것을 우연히 마주쳤다. 반가워서 인사를 나누었는데 아주머니가 애가 하나 더 있다고 했다. 그 애가 딸일 확률은 얼마일까? it-freelancer.tistory.com 2. 팩토리알 구현 연습 R 함수 작성 연습 factorial

ADP (R) 2022.07.26

[ADP 실기 대비 연습 문제] 조건부 확률 문제 모음

문제1 새로 이사 온 옆집 아주머니가 딸과 함께 나오는 것을 우연히 마주쳤다. 반가워서 인사를 나누었는데 아주머니가 애가 하나 더 있다고 했다. 그 애가 딸일 확률은 얼마일까? 단, 아들과 딸을 낳을 확률은 각각 1/2이라고 하자. 출처 : https://blog.naver.com/kiashorizon/221383415312 더보기 정답 : 1/3 문제2 새로 이사 온 옆집 아주머니가 딸과 함께 나오는 것을 우연히 마주쳤다. 반가워서 인사를 나누었는데 아주머니가 애가 둘인데 그 아이의 동생이 한 명 있다고 했다. 그 애가 딸일 확률은 얼마일까? 단, 아들과 딸을 낳을 확률은 각각 1/2이라고 하자. 출처 : https://blog.naver.com/kiashorizon/221383415312 더보기 정답..

ADP (R) 2022.07.25

[R 연습 문제] tapply 코드를 purrr::map 으로 변환하기

1. 문제 chickwts 데이터를 feed 별로 weight 의 합을 tapply 함수를 이용하여 다음과 같이 구할 수 있다. > tapply(chickwts$weight,chickwts$feed,sum) casein horsebean linseed meatmeal soybean sunflower 3883 1602 2625 3046 3450 3947 tapply 함수 대신 split 함수와 purrr 패키지의 map_* 함수를 이용하여 동일한 결과를 구하라 2. 정답 library(purrr) chickwts %>% split(.$feed) %>% map_df(~sum(.$weight)) 3.시행 착오 purrr 을 이용해야 진정한 R 사용자 ! 라고 하여 연습하였습니다. ?map 을 통해 설명서를 보..

ADP (R) 2022.07.20

오늘의 ADP 준비 / 2022-07-19 화(D68)

D-day : 제26회 데이터분석 전문가(실기) 9월 25일 일요일 to-do ---------------------------------- No 구분 todo 기타 1 머신러닝 EDA 계획 - 수치 범주형 모델별 비교 기출문제 2 통계 모수 비모수 검정 기출문제 3 시계열 acf pacf 개념 잡기 기출문제 magrittr done ---------------------------------- ?pacman::p_load 일독 to-do 정리 시작 ymd(20220925) - today() Time difference of 68 days barplot study https://youtu.be/ZPw2zzLXLrQ ?barplot barplot(cbind(Employed, Unemployed) ~ Yea..

ADP (R) 2022.07.19

[ADP 실기 study log] ADP 23회 객실사용여부 (풀이중)

1. 문제 온,습도,조도,CO2농도에 따른 객실의 사용유무 판별 종속변수 Occupancy, 0: 비어있음 , 1: 사용중 데이터 경로 : /kaggle/input/adp-kr-p1/problem1.csv 1 - (1) 데이터 EDA 수행 후, 분석가 입장에서 의미있는 탐색 1 - (2) 결측치를 대체하는 방식 선택하고 근거제시, 대체 수행 1 - (3) 추가적으로 데이터 질을 향상시킬만한 내용 작성(구현 안하고 설명만해도 됨) 2 - (1) 데이터에 불균형이 있는지 확인, 불균형 판단 근거 작성 2 - (2) 오버샘플링 방법들 중 2개 선택하고 장단점 등 선정 이유 제시 2 - (3) 오버샘플링 수행 및 결과, 잘 되었다는 것을 판단해라 3 - (1) 속도측면, 정확도측면 모델 1개씩 선택, 선택 이유..

ADP (R) 2022.07.15

[ADP 실기 study log] ADP 23회 코로나 시계열 데이터

1. 문제 ADP 23회 (출처1:https://cafe.naver.com/sqlpd/28193) 출처2 : https://www.kaggle.com/code/kukuroo3/problem-r-base?scriptVersionId=87642636 코로나 시계열 데이터 5만 관측치 가량, 날짜, 코로나 누적확진자 등 변수 3개 1. ACF 사용해서 distance 계산 (10) 2 계층적 군집 분석을 위해 덴드로그램 작성 (10) 2. 답안 1. ACF 사용해서 distance 계산 (10) rm(list=ls()) pacman::p_load(tidyverse,magrittr,lubridate,reshape2,recipes,forecast, factoextra, dtw) library(TSdist) tem..

ADP (R) 2022.07.14