분류 전체보기 458

오늘의 ADP 준비 / 2022-08-03 수(D53)

ggplot2 시각화 관련 유튜브 영상을 들으면서 출근을 했습니다. 출근길에 3번 정도 반복해서 들은 것 같아요. 관련 영상 : R 프로그래밍 / R 기초 - ggplot2 그래픽1 - 구조와 그래프 생성 https://youtu.be/nd-sNVdmm8A 이미 여러번 들었던 spine barplot 영상과 svm 강의 영상의 ggplot2 시각화 코드를 복습하고 반복 연습을 좀 해야겠어요. unused arguments 오류 해결 어제 MASS 패키지에서 제공하는 Boston 데이터를 dplyr 로 가공하는 과정에서 발생했던 unused arguments 오류를 해결했어요. https://it-freelancer.tistory.com/88 [R] unused arguments 오류 해결 1. 문제 dp..

ADP (R) 2022.08.03

[R] unused arguments 오류 해결

1. 문제 dplyr 패키지의 select 함수를 사용하다가 갑자기 오류메시지가 떴습니다. MASS 패키지에서 제공하는 Boston 데이터를 dplyr 로 가공하는 과정이었습니다. library(dplyr) library(MASS) data(Boston) Boston Boston %>% mutate(y=rm,x=lstat) %>% select (rm,lstat) %>% head() Error in select(., rm, lstat) : unused arguments (rm, lstat) 평소 잘 쓰던 기능이 갑자기 Error 를 뿌리니 깜짝 놀랐습니다. 2. 재현 재현 및 troubleshooting 효율성을 위해 Boston 데이터 부분을 mtcars 로 변경하여 진행해볼께요. library(dply..

카테고리 없음 2022.08.02

오늘의 ADP 준비 / 2022-08-02 화(D54)

Scheffe 검정 Contrasts 개념에 대해서 이해하려고 자료를 좀 더 찾아보았습니다. 충분히 이해하려면 아직도 한참 더 공부해야겠어요. 기출 풀이 [Adp 실기 기출 풀이] 22회 다항회귀 3차까지 (풀이중...) https://it-freelancer.tistory.com/83 다항회귀분석 국민대 곽기영 교수님 유튜브 영상 공부. abline lines 함수 기능 공부가 조금 더 필요해요. 로에스추세선 처리가 smoother="loessLine" 이 아니라 smoother=loessLine 이란 점 주의해야 합니다. library(car) str(Prestige) Prestige.lm mean(Prestige$education))) lm(income ~ education, data=Prestig..

ADP (R) 2022.08.02

전립선암 분자진단/암유전자 검사를 받는 것이 좋을까요?

의학은 쥐뿔도 모르지만 전립선암을 열심히 공부하고 있는 멋쟁이천재사자입니다. 검사를 할지 여부는 NCCN 가이드라인에 따르면 Risk Group 에 따라 달라져야 합니다. 분자진단이나 유전자검사는 조기 진단이나 정확도 측면에서 효과가 좋은 반면 비용은 많이 드나 봐요. 그래서 불필요한 진단이나 치료를 막기 위해 NCCN에서는 가이드라인을 만들었네요. High 이상의 Risk Group 은 유전자검사를 고려해야 하지만, 그렇지 않은 그룹은 강한 가족력이 있는 경우에만 고려할 필요가 있어요. 분자진단은 대개는 권장하지 않지만,기대 수명이 10년 이상이고 Risk Group 이 중간 이하일 때 고려할 필요가 있다네요. 어떤 Risk Group 에 속하는지는 조직검사 결과와 혈액검사 결과 등을 종합해서 판단해야..

프리랜서/CDW 2022.08.02

오늘의 ADP 준비 / 2022-07-31 일(D56)

관리도 공부 22회에서 관리도 문제가 출제되었다고 하여 관리도 관련 유튜브 영상을 몇 개 공부했습니다. 관련 기출문제 : ADP 22회 2. 통계분석 (data: 금속 성분 함유량 데이터) 불량률 관리도에 따른 관리 중심선, 관리 상한선, 하한선 구하기 (각 공식 있음), 관리도 시각화 출처: 관리도 선택 https://youtu.be/2i38RRmwpVk 관리도 Control chart https://youtu.be/vsTcmfP3u1A 출처 : SPC 7강 관리도활용 https://youtu.be/50r4xeHkwoY 편상관계수 PACF, 상호작용 효과, 조절변수... 이런 개념들과 관련성이 있을 듯 해서 공부를 했습니다. str(mtcars) mtcars2 pcor.test(mtcars2["mpg"..

ADP (R) 2022.07.31

[ADsP] 회귀모형의 통계적 유의성과 F통계량

회귀분석에서 F통계량은 몇 이상이어야 유의하다고 볼 수 있나요? 오픈채팅방에서 어떤 분의 질문입니다. 교재내용을 자세히 보겠습니다. p-value 는 5% 라는 임계치가 있어서 좋은데, F 통계량은 그런 기준이 있는지 궁금하다는 내용이지요. F-statistic의 p-value 는 집단간 분산 자유도(3) , 집단내 자유도(89)에 의해 계산이 되므로 그 자체로 어떤 임계치를 정할 수는 없습니다. > pf(37.98, 3, 89 ,lower.tail = F) [1] 6.739042e-16 이런한 관계는 F분포의 모습을 확인해보면 알 수 있습니다. 자유도에 따라 다양한 모습의 곡선으로 나타나며, 큰 쪽의 꼬리 부분 면적이 5%에 해당하는 x값(F 통계량에 해당)은 곡선마다 모두 다릅니다. F통계량이 1.5..

ADP (R)/ADsP 2022.07.31

Scheffe 사후검정

ANOVA 사후분석 중 하나인 scheffe 검증에 대해 공부하고 있습니다. 집단간 자료수가 동일하지 않은 경우에도 사용할 수 있다고 하니 꼭 알아두어야 할 검정방법인 듯 합니다. agricolae 패키지의 샘플로 공부를 시작합니다. sweetpotato 데이터의 건수가 매우 작아 aov 대신 비모수검정을 해야하는 것 아닌가 궁금합니다만 일단 지나갈께요. library(agricolae) data(sweetpotato) # 비모수 해야하는 것 아닌가? model

ADP (R) 2022.07.31

오늘의 ADP 준비 / 2022-07-29 금(D58)

1. 기출문제 복원 및 풀이 연습 : [Adp 실기 기출 풀이] 25회 5번 공장 순위 문제 aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다. 공장별로 생산되는 제품 무게에 차이가 있는지 검증하라. 2. 유튜브 스터디 : #공학수학 #공돌이 카이제곱 분포와 검정 카이제곱 통계량 피어스 카이제곱 통계량 3. Kruskal–Wallis test 와 Kruskal–Wallis H test 는 같은 의미인가? .. 4. 동률 순위에 따른 처리 이해가 아직 안된다 출처 : https://en.wikipedia.org/wiki/Kruskal%E2%80%93Wallis_one-way_analysis_of_variance#cite_note-Laerd-1..

ADP (R) 2022.07.29

[Adp 실기 기출 풀이] 25회 5번 공장 순위 문제

웹에 공유된 정보를 활용하여 문제를 만들어 풀어 보았습니다. 올바른 답인지도 불확실하며, 문제가 올바른지도 불확실합니다. 참고한 자료 link https://lovelydiary.tistory.com/381 https://blog.naver.com/sbp3636/222778320496 문제 aa 에 x y z 3개의 공장(group칼럼)에서 생산된 총 32개 제품 무게의 순위정보(rank 칼럼)가 있다. 공장별로 생산되는 제품 무게에 차이가 있는지 검증하라. * 데이터 생성용 script library(dplyr) mtcars %>% mutate(rank = rank(mpg)) %>% mutate(group = ifelse(cyl==4,'x',ifelse(cyl==6,'y','z'))) %>% arran..

ADP (R) 2022.07.29