ADP (R) 111

결정계수(R2) 계산

ADsP 기출 문제로 결정계수 구하는 문제가 나왔다고 합니다. 실제 기출은 주관식이었을 수도 있습니다만, R 내장 데이터 mtcars 를 이용하여 객관식으로 문제를 만들어 보았습니다. 문제 아래의 결과를 사용하여 결정계수(R2)를 계산하시오 > anova(lm(mpg~hp,data=mtcars)) Analysis of Variance Table Response: mpg Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.37 678.37 45.46 1.788e-07 *** Residuals 30 447.67 14.92 ① 447.67 / 678.37 2 ② 678.37 / (678.37+447.67) ③ 678.37 / (678.37+14.92) ④ 30 / 45.46 정답 더보기..

ADP (R)/ADsP 2022.08.04

오늘의 ADP 준비 / 2022-08-03 수(D53)

ggplot2 시각화 관련 유튜브 영상을 들으면서 출근을 했습니다. 출근길에 3번 정도 반복해서 들은 것 같아요. 관련 영상 : R 프로그래밍 / R 기초 - ggplot2 그래픽1 - 구조와 그래프 생성 https://youtu.be/nd-sNVdmm8A 이미 여러번 들었던 spine barplot 영상과 svm 강의 영상의 ggplot2 시각화 코드를 복습하고 반복 연습을 좀 해야겠어요. unused arguments 오류 해결 어제 MASS 패키지에서 제공하는 Boston 데이터를 dplyr 로 가공하는 과정에서 발생했던 unused arguments 오류를 해결했어요. https://it-freelancer.tistory.com/88 [R] unused arguments 오류 해결 1. 문제 dp..

ADP (R) 2022.08.03

오늘의 ADP 준비 / 2022-08-02 화(D54)

Scheffe 검정 Contrasts 개념에 대해서 이해하려고 자료를 좀 더 찾아보았습니다. 충분히 이해하려면 아직도 한참 더 공부해야겠어요. 기출 풀이 [Adp 실기 기출 풀이] 22회 다항회귀 3차까지 (풀이중...) https://it-freelancer.tistory.com/83 다항회귀분석 국민대 곽기영 교수님 유튜브 영상 공부. abline lines 함수 기능 공부가 조금 더 필요해요. 로에스추세선 처리가 smoother="loessLine" 이 아니라 smoother=loessLine 이란 점 주의해야 합니다. library(car) str(Prestige) Prestige.lm mean(Prestige$education))) lm(income ~ education, data=Prestig..

ADP (R) 2022.08.02

오늘의 ADP 준비 / 2022-07-31 일(D56)

관리도 공부 22회에서 관리도 문제가 출제되었다고 하여 관리도 관련 유튜브 영상을 몇 개 공부했습니다. 관련 기출문제 : ADP 22회 2. 통계분석 (data: 금속 성분 함유량 데이터) 불량률 관리도에 따른 관리 중심선, 관리 상한선, 하한선 구하기 (각 공식 있음), 관리도 시각화 출처: 관리도 선택 https://youtu.be/2i38RRmwpVk 관리도 Control chart https://youtu.be/vsTcmfP3u1A 출처 : SPC 7강 관리도활용 https://youtu.be/50r4xeHkwoY 편상관계수 PACF, 상호작용 효과, 조절변수... 이런 개념들과 관련성이 있을 듯 해서 공부를 했습니다. str(mtcars) mtcars2 pcor.test(mtcars2["mpg"..

ADP (R) 2022.07.31

[ADsP] 회귀모형의 통계적 유의성과 F통계량

회귀분석에서 F통계량은 몇 이상이어야 유의하다고 볼 수 있나요? 오픈채팅방에서 어떤 분의 질문입니다. 교재내용을 자세히 보겠습니다. p-value 는 5% 라는 임계치가 있어서 좋은데, F 통계량은 그런 기준이 있는지 궁금하다는 내용이지요. F-statistic의 p-value 는 집단간 분산 자유도(3) , 집단내 자유도(89)에 의해 계산이 되므로 그 자체로 어떤 임계치를 정할 수는 없습니다. > pf(37.98, 3, 89 ,lower.tail = F) [1] 6.739042e-16 이런한 관계는 F분포의 모습을 확인해보면 알 수 있습니다. 자유도에 따라 다양한 모습의 곡선으로 나타나며, 큰 쪽의 꼬리 부분 면적이 5%에 해당하는 x값(F 통계량에 해당)은 곡선마다 모두 다릅니다. F통계량이 1.5..

ADP (R)/ADsP 2022.07.31

Scheffe 사후검정

ANOVA 사후분석 중 하나인 scheffe 검증에 대해 공부하고 있습니다. 집단간 자료수가 동일하지 않은 경우에도 사용할 수 있다고 하니 꼭 알아두어야 할 검정방법인 듯 합니다. agricolae 패키지의 샘플로 공부를 시작합니다. sweetpotato 데이터의 건수가 매우 작아 aov 대신 비모수검정을 해야하는 것 아닌가 궁금합니다만 일단 지나갈께요. library(agricolae) data(sweetpotato) # 비모수 해야하는 것 아닌가? model

ADP (R) 2022.07.31

오늘의 ADP 준비 / 2022-07-29 금(D58)

1. 기출문제 복원 및 풀이 연습 : [Adp 실기 기출 풀이] 25회 5번 공장 순위 문제 aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다. 공장별로 생산되는 제품 무게에 차이가 있는지 검증하라. 2. 유튜브 스터디 : #공학수학 #공돌이 카이제곱 분포와 검정 카이제곱 통계량 피어스 카이제곱 통계량 3. Kruskal–Wallis test 와 Kruskal–Wallis H test 는 같은 의미인가? .. 4. 동률 순위에 따른 처리 이해가 아직 안된다 출처 : https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance#cite_note-Laerd-1..

ADP (R) 2022.07.29

[Adp 실기 기출 풀이] 25회 5번 공장 순위 문제

웹에 공유된 정보를 활용하여 문제를 만들어 풀어 보았습니다. 올바른 답인지도 불확실하며, 문제가 올바른지도 불확실합니다. 참고한 자료 link https://lovelydiary.tistory.com/381 https://blog.naver.com/sbp3636/222778320496 문제 aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다. 공장별로 생산되는 제품 무게에 차이가 있는지 검증하라. * 데이터 생성용 script library(dplyr) mtcars %>% mutate(rank = rank(mpg)) %>% mutate(group = ifelse(cyl==4,'x',ifelse(cyl==6,'y','z'))) %>% arran..

ADP (R) 2022.07.29

[ADP 실기 study log] 25회 5번 공장 순위 문제 kruskal.test

1. kruskal.test exmaple 데이터를 엑셀로 구해보기 ?kruskal.test 를 통해 example 을 확인합니다. ## Hollander & Wolfe (1973), 116. ## Mucociliary efficiency from the rate of removal of dust in normal ## subjects, subjects with obstructive airway disease, and subjects ## with asbestosis. x % summarise(N = length(Wage$wage), S_t_2 = sum(rank_sum^2/n), S_r_2 = sum(rank(Wage$wage)^2), C = (N*(N+1)^2 / 4), Chisq = ((N-1)*(..

ADP (R) 2022.07.27