빅분기

빅분기 작업형 1유형 연습 문제[R]

멋쟁이천재사자 2022. 7. 15. 19:02

빅분기 실기 1유형을 R 로 연습한 문제와 답안입니다.

 

DataManim  싸이트 문제를 groom 에서 연습할수 있는 R 기본데이터로 변형하여 풀어보았습니다. 

참고싸이트: https://www.datamanim.com/dataset/practice/q1.html

시험전에는 print(a) 방식으로 연습하였으나, 4회 실기시험 지시사항에 따라 cat(a) 로 작성하였습니다.

 

문제 1.

airquality 데이터의 Ozone 수치를 10 단위로 변환 했을 때, 가장 많은 건수를 가진 구간은? (0~9 : 0 , 10~19 : 10,,,) 

 

 

library(dplyr) 
airquality %>% mutate(gugan=Ozone%/%10*10) %>%  
         group_by(gugan) %>% 
         summarize(cnt=n()) %>% 
         arrange(desc(cnt)) %>% 
         filter(!is.na(gugan)) -> dd 
  
a <- as.numeric(dd[1,1])
cat(a) 

10

 

* 참고 : R Studio 가 아닌 groom 체험환경에서 연습했습니다.



문제 2.

airquality 데이터의 Ozone 수치를 10 단위로 변환 했을 때, 가장 많은 구간대의 건수?  

 

library(dplyr) 
airquality %>% mutate(gugan=Ozone%/%10*10) %>%  
         group_by(gugan) %>% 
         summarize(cnt=n()) %>% 
         arrange(desc(cnt)) %>% 
         filter(!is.na(gugan)) -> dd 
a <- as.numeric(dd[1,2])   
cat(a) 

23 
  
  

문제 3.

airquality 데이터의 Ozone 수치가 25 이상 29 미만인 행들중 Month 가 5 인 건수는? 
  

library(dplyr) 
airquality %>% filter(Ozone>=25,Ozone<29) %>% 
          filter(Month ==5) -> dd 
a<- nrow(dd)
cat(a) 


 

문제 4.

airquality 데이터의 Ozone 이 NA 인 경우 Wind 컬럼 값의 정규성을 검정하고자 한다. 샤피로 검정의 p-value값을 구하여라 
  

dd<- airquality[is.na(airquality$Ozone),3] 
a <- shapiro.test(dd)$p.value
cat(a) 

0.6121913 
  
  

문제 5.

survey 데이터 (MASS 패키지)의 Sex 변수와 Fold 변수는 독립인지 카이제곱검정을 통해 확인하려한다. p-value값을 출력하라 
  

library(MASS) 
a<-chisq.test(survey$Sex,survey$Fold)$p.value
cat(a) 

0.2760772 

 

 

 

[R]빅분기 실기 단답형(F1 스코어 구하기)글로 이동