빅분기 실기 1유형을 R 로 연습한 문제와 답안입니다.
DataManim 싸이트 문제를 groom 에서 연습할수 있는 R 기본데이터로 변형하여 풀어보았습니다.
참고싸이트: https://www.datamanim.com/dataset/practice/q1.html
시험전에는 print(a) 방식으로 연습하였으나, 4회 실기시험 지시사항에 따라 cat(a) 로 작성하였습니다.
문제 1.
airquality 데이터의 Ozone 수치를 10 단위로 변환 했을 때, 가장 많은 건수를 가진 구간은? (0~9 : 0 , 10~19 : 10,,,)
library(dplyr)
airquality %>% mutate(gugan=Ozone%/%10*10) %>%
group_by(gugan) %>%
summarize(cnt=n()) %>%
arrange(desc(cnt)) %>%
filter(!is.na(gugan)) -> dd
a <- as.numeric(dd[1,1])
cat(a)
10
* 참고 : R Studio 가 아닌 groom 체험환경에서 연습했습니다.
문제 2.
airquality 데이터의 Ozone 수치를 10 단위로 변환 했을 때, 가장 많은 구간대의 건수?
library(dplyr)
airquality %>% mutate(gugan=Ozone%/%10*10) %>%
group_by(gugan) %>%
summarize(cnt=n()) %>%
arrange(desc(cnt)) %>%
filter(!is.na(gugan)) -> dd
a <- as.numeric(dd[1,2])
cat(a)
23
문제 3.
airquality 데이터의 Ozone 수치가 25 이상 29 미만인 행들중 Month 가 5 인 건수는?
library(dplyr)
airquality %>% filter(Ozone>=25,Ozone<29) %>%
filter(Month ==5) -> dd
a<- nrow(dd)
cat(a)
1
문제 4.
airquality 데이터의 Ozone 이 NA 인 경우 Wind 컬럼 값의 정규성을 검정하고자 한다. 샤피로 검정의 p-value값을 구하여라
dd<- airquality[is.na(airquality$Ozone),3]
a <- shapiro.test(dd)$p.value
cat(a)
0.6121913
문제 5.
survey 데이터 (MASS 패키지)의 Sex 변수와 Fold 변수는 독립인지 카이제곱검정을 통해 확인하려한다. p-value값을 출력하라
library(MASS)
a<-chisq.test(survey$Sex,survey$Fold)$p.value
cat(a)
0.2760772
'빅분기' 카테고리의 다른 글
[R] 빅분기 작업형 1형 연습 문제 (칼럼명 구하기) (0) | 2022.11.15 |
---|---|
[R]빅분기 실기 단답형(F1 스코어 구하기) (0) | 2022.07.27 |
ADsP 빅분기 ADP필기 원트 연속 합격 (1) | 2022.07.10 |
제4회 빅데이터분석기사 실기 만점 후기 3/3 (작업형 2형) (0) | 2022.07.09 |
제4회 빅데이터분석기사 실기 만점 후기 2/3 (작업형 1형) (0) | 2022.07.08 |