ADP (R)

ADP 실기 26회 후기(문제 포함)

멋쟁이천재사자 2022. 9. 25. 22:54

필기 합격 후 실기 원트였는데 정말 어려웠어요.

 

제한시간을 두고 푸는 연습도 좀 필요할 것 같다는 생각을 하게 되었습니다.

 

머신러닝 KNN 어쩌고 추천 나올 때부터 힘들었고 손도 못 댄 부분이 많았네요. NbClust 를 이용하여 적합한 군집수를 산출하려다가 RStudio 재시작을 서너번 했는데 결국 안되서 포기하고 그냥 5라고 가정하고 진행했어요.

베이지안회귀는 보자마자 포기했다가 마지막 30분 남기고 help 쳐서 패키지 검색했는데 bayesreg 발견하고 허접하게 대충 썼는데 점수는 못 받을 것 같습니다. 디폴트 옵션 주고 회귀식은 어거지로 만들었는데 predict 는 오류 해결 못해서 아예 못 풀었어요. 


다음 실기를 준비하며 기억 나는대로 적어보겠습니다. 수치는 정확하지 않습니다. 문제 번호나 순서도 다를 수 있습니다.

 

머신러닝 문제


1.

35000 개 정도의 구매내역 데이터 xxxx.csv 를 이용하여 군집분석 해라
1-1 k-means PAM 등의 기법을 이용하여 군집분석해라
1-2 결측치를 식별하고 처리해라
1-3 이상치를 제거하고 제거후에 이상치 제거가 잘 되었는지 통계적으로 제시하라


2-1 군집별로 어떤 의미가 있는지 비즈니스적인 판단을 해라
2-2 군집분류가 잘 되었는지 평가하라
2-3 31412 고객에 Knn 기법을 이용하여 추천할 상품을 제시해라

 

통계 문제


3 철강제품의 불량률을 조사하는데 불량률90%인데 허용한계오차를 5% 이내려 하려고 할 때 필요한 적절한 표본의 크기 중 최소 표본수는?

4 남자 여자의 혈압 데이터.  순번,남자,여자 3개 칼럼. 14개 행에 여자는 5개 정도가 NA 였음. 남녀 간에 혈압의 차이가 있는지 검정하려고 한다.
4-1. 귀무가설과 연구가설을 설정하라
4-2. 소수점 2자리 반올림하여 통계량 구하고 95% 수준에서 연구가설 채택여부 결정.


5. 다음 표를 보고 후보A 지지율이 선거구별로 차이가 있는지를 검정하라
후보 A 지지율 관련 표. 
구분칼럼 : 지지한다 지지안한다

선거구 칼럼 :  1번 2번 3번


5-1. 귀무가설과 연구가설을 설정하라
5-2. 소수점 2자리 반올림하여 통계량 구하고 95% 수준에서 연구가설 채택여부 결정.


6

데이터 : 1월 ~9월까지 9개월간의 국제 Silver 가격. 
6-1 1월 대비 9월의 은값 상승률을 소수점 2자리 반올림하여 구하라
6-2 은값의 추이를 이동평균(3N)과 함께 나타나도록 시각화하라


7 몸무게 키 허리둘레 3개 칼럼으로 구성된 weight.csv 파일을 읽어서 다음을 구하라.
7-1 회귀계수를 소수점2자리 반올림하여 구하라. 조건을 엄청 많은 주었는데 burnin 은 1000 으로 하고 MCMC는 10000 이상 되게하고 prior 어쩌고는 역감마함수를 사용하고 Improper XXX XXX XXX 를 사용해라
7-2 주어진 식을 이용하여 몸무게 75 키 170 인 사람의 허리둘레를 예측하라