ADP (R)/ADsP 10

혼동행렬(3)

2022년 2월 26일 치러진 제32회 ADsP 시험을 92점으로 합격했습니다. 이후 도전한 빅데이터분석기사와 ADP도 모두 합격을 하였습니다. 지난 포스트에서 혼동행렬과 관련된 몇 가지 내용을 살펴보았습니다. 위양성 민감도 특이도의 개념 민감도 특이도 지표의 필요성 요약하면 다음과 같습니다. 위양성 = 거짓 양성 = False Positive 민감도 = 환자를 환자라고 맞추는 지표 정밀도(precision) = 불량품 검사 결과의 정확도 정확도(정분류율) 단점 = 발병률이 천명 당 한명이면 무조건 정상이라고 찍어도 99.9%의 높은정확도 나옴 이번에는 Wiki 에서 혼동행렬표를 하나 가져왔습니다. 반드시 암기해야합니다. 출처 : https://en.wikipedia.org/wiki/Confusion_m..

ADP (R)/ADsP 2023.03.05

혼동행렬(1) 위양성 민감도 정밀도

2022년 2월 26일 치러진 제32회 ADsP 시험을 92점으로 합격했습니다. 이후 도전한 빅데이터분석기사와 ADP도 모두 합격을 하였습니다. 혼동 행렬에 나오는 각종 용어들은 시험공부하던 시절에도 지금도 항상 혼동스럽고 어렵습니다. 요새는 정보처리기사 실기 시험을 준비하고 있는데요, 이곳에도 혼동이라는 용어가 등장합니다. Claude Shannon 선생님께서 일찌기 암호학 관련하여 혼동과 확산을 설파하셨다고 합니다. 혼동행렬을 한 번 정리하고 넘어가야지 안 되겠습니다.In cryptography, confusion and diffusion are two properties of the operation of a secure cipher identified by Claude Shannon in his ..

ADP (R)/ADsP 2023.02.23

연관분석 이야기(4)

지난 포스트에서 지지도,신뢰도,향상도 계산 문제와, 장바구니 분석 R 경험담을 공유했습니다. 신뢰도 지지도 향상도 구하기 초간단 문제 ADsP 기출문제 RCC invasion 데이터를 이용한 분석 사례 최근에 정보관리기술사 기출 문제를 쭈욱 보다가 119회에 굉장히 반가운 키워드로 구성된 문제를 확인했습니다. 빅데이터분석기사 그리고 ADsP, ADP를 보유하고 있습니다. 장바구니 분석에 대해서는 R 을 통해 실습도 해보았지요. 기술사 문제는 문제 당 3페이지 정도 분량의 답안을 서술해야 하는 것으로 들었습니다. 처음 들어본 키워드로 가득한 문제들 중 이렇게도 친숙한 문제인데도 몇 줄을 작성할 수 있을지 자신이 없습니다. 다음 포스팅에서는 아래 문제에 대해서 좀 더 연구하고 답안 작성을 위한 공부를 해보겠..

ADP (R)/ADsP 2023.02.07

[ADsP] 분석기획 암기노트

ADsP 2과목 분석기획은 외울 것이 많아 은근 부담됩니다. 잘 외워두면 빅데이터분석기사와 ADP 에도 도움이 될 것 같아 저는 엑셀로 정리하며 공부했습니다. 목준가기검 SPTDI BDDMED 분데데시평 도목계보 저만이 알아볼 두음들입니다. 작년 2월 26일 ADsP 합격 이후에도 4월 9일 빅데이터분석기사 필기와 5월 21일 ADP필기를 준비하면서 몇 번이고 열어보고 업데이트했던 엑셀 파일입니다. 도목계보 마지막 칼럼 데이터분석 5단계의 첫번째 절차의 상세항목에 적어둔 두음입니다. 평생 두음 암기법을 사용해보지 않았는데 ADsP 준비하면서 처음으로 시도해보았습니다. 이것도 요령이 필요한가 봅니다. 도목계보는 몇 번이고 다시 봐도 도무지 무슨 의도였는지 기억을 못 해냈습니다. 빅데이터분석기사 준비용으로 ..

ADP (R)/ADsP 2023.02.06

연관분석 이야기(3)

장바구니 분석에 대해 처음 들은 것은 5년 전쯤 아니면 그 이전이었습니다. 그 유명한 기저귀 사러 간 김에 맥주도 사간다는 이야기 있잖아요. 참 그럴싸하게 들렸어요. 나중에 어떤 글을 보니, 기저귀 맥주 이야기가 겉으로는 그럴싸하게 들리지만 실제 마케팅에 활용해보니 별 도움이 안됐다고도 합니다. 팩트 체크를 안해봐서 정말인지 아닌지는 잘 모르겠습니다. 그로부터 시간이 꽤 흘렀지요. 작년 초 이맘 때 쯤이었을까요? 업무로는 RCC(신장암중 대표 유형의 암종) 레지스트리 구축 업무를 담당한지 두어달 지나 적응이 좀 되었고, 개인적으로는 ADsP 합격 후에 ADP 를 준비하던 중이었지요.RCC 공부도 할 겸, ADP 실기 연습도 할 겸해서 Tumor(종양) invasion 을 가지고 연관 분석을 해보았습니다...

ADP (R)/ADsP 2023.02.03

연관분석 이야기(2)

지난 포스팅에서 ADsP 단골 문제인 지지도,신뢰도,향상도 계산 문제 초간단 샘플을 공유했습니다. 두번째 포스팅에서는 신장암 레지스트리 구축하면서 재미삼아 해 보았던 RCC invasion 연관분석 경험담을 공유하려고 했습니다. 그런데 오픈채팅방에 연관분석 질문이 있어서, 답변하는 포스팅을 먼저 해보겠습니다. 네이버 카페 "데이터 전문가 포럼"에도 연관분석 지표 계산 문제 질문이 종종 올라옵니다. 신뢰도, 향상도 계산 문제가 머리 아픈 것은 저를 포함해서 많은 분들이 공통으로 느끼는 어려움인 듯 합니다. 1. 질문 2. 정답보기를 눌러 정답을 확인하세요 혹시 제가 틀린 걸까요? 그렇다면 댓글 부탁드립니다. 더보기 정답은 3번 입니다. 3. 지문 4번 설명 연관분석의 3가지 대표 지표는 지지도, 신뢰도, ..

ADP (R)/ADsP 2023.02.02

연관분석 이야기 (1)

연관분석 또는 장바구니 분석에는 지지도 신뢰도 향상도라는 개념이 있습니다. ADsP 를 준비할 때 반드시 알아야 하는 빈출 문제입니다. 개념과 계산 방법을 확실히 익혀둘 필요가 있습니다. 문제를 하나 풀어볼까요? 총거래수가 4건 뿐인 다음 데이터를 이용하여 '기저귀 -> 맥주'의 지지도,신뢰도,향상도를 구해보세요 거래번호 구매한 상품 1003 기저귀, 맥주, 빵 1056 기저귀, 맥주 1071 기저귀, 빵, 음료수 2005 빵, 음료수, 커피 더보기 지지도 : 2/4

ADP (R)/ADsP 2023.01.29

ADsP 준비 추천 영상

24회 ADsP 시험을 92점으로 합격한 멋쟁이천재사자입니다. EduAtoZ 무료 요약 영상은 ADsP 준비하는데 많은 도움이 되었습니다. 저는 무료 영상 대부분을 여러번 보았는데, 아래 5개는 정말 정말 여러번 반복해서 들었습니다. 1. 데이터 이해 https://youtu.be/8YN9vZp495E 2. 데이터 분석 기획 https://youtu.be/SV7SUePZZFw 3. 데이터 분석 https://youtu.be/2OhYHhgTQtE https://youtu.be/S3UYgwAjL_U https://youtu.be/MuJUhXoM-9E 비전공 통알못을 위한 추천 영상 3일 컷, 5일 컷 이야기를 하시는 분들도 많지만, 급하게 시험 접수하고 공부 시작한 분들 중 3과목 시작하면서 멘붕이신 분들 ..

ADP (R)/ADsP 2022.08.05

결정계수(R2) 계산

ADsP 기출 문제로 결정계수 구하는 문제가 나왔다고 합니다. 실제 기출은 주관식이었을 수도 있습니다만, R 내장 데이터 mtcars 를 이용하여 객관식으로 문제를 만들어 보았습니다. 문제 아래의 결과를 사용하여 결정계수(R2)를 계산하시오 > anova(lm(mpg~hp,data=mtcars)) Analysis of Variance Table Response: mpg Df Sum Sq Mean Sq F value Pr(>F) hp 1 678.37 678.37 45.46 1.788e-07 *** Residuals 30 447.67 14.92 ① 447.67 / 678.37 2 ② 678.37 / (678.37+447.67) ③ 678.37 / (678.37+14.92) ④ 30 / 45.46 정답 더보기..

ADP (R)/ADsP 2022.08.04

[ADsP] 회귀모형의 통계적 유의성과 F통계량

회귀분석에서 F통계량은 몇 이상이어야 유의하다고 볼 수 있나요? 오픈채팅방에서 어떤 분의 질문입니다. 교재내용을 자세히 보겠습니다. p-value 는 5% 라는 임계치가 있어서 좋은데, F 통계량은 그런 기준이 있는지 궁금하다는 내용이지요. F-statistic의 p-value 는 집단간 분산 자유도(3) , 집단내 자유도(89)에 의해 계산이 되므로 그 자체로 어떤 임계치를 정할 수는 없습니다. > pf(37.98, 3, 89 ,lower.tail = F) [1] 6.739042e-16 이런한 관계는 F분포의 모습을 확인해보면 알 수 있습니다. 자유도에 따라 다양한 모습의 곡선으로 나타나며, 큰 쪽의 꼬리 부분 면적이 5%에 해당하는 x값(F 통계량에 해당)은 곡선마다 모두 다릅니다. F통계량이 1.5..

ADP (R)/ADsP 2022.07.31