개발/Data Science

데이터분석 준 전문가(ADsP) 기출 25회 오답

huiyu 2023. 3. 7. 06:38

[1과목 데이터 이해]

문제 1. 다음 중 통찰력과 관련된 핵심 질문이 아닌 것은?
 1) 권고
 2) 최적화
 3) 실험 설계
 4) 경고

  과거 현재 미래
정보 무슨 일이 일어났는가?(리포팅) 무슨 일이 일어나고 있는가?(경고) 무슨 일이 일어날 것인가?(추출)
통찰력 어떻게, 왜 일어났는가?
(모델링, 실험설계 등)
차선 행동은 무엇인가?(권고) 최악/최선의 상황은?
(예측/최적화/시뮬레이션)

 

[2과목 데이터 분석 기획]

문제 2. 다음 중 분석 과제 정의서에 대한 설명 중 옳지 않은 것은?
 1) 분석 과제 정의서는 소스데이터, 데이터 입수 및 분석의 난이도, 분석 방법 등에 대한 항목이 포함되어야 한다.
 2) 분석 과제 정의서는 프로젝트를 수행하는 이해 관계자가 프로젝트의 방향을 설정하고 성공여부를 판별할 수 있는 자료이다.
 3) 분석 과제 정의서는 프로젝트 계획서를 작성하기 위한 중간 결과로써 구성항목으로 도출할 필요가 없다.
 4) 분석 과제 정의서는 분석 모델에 적용될 알고리즘과 분석 모델의 기반이 되는 Feature가 포함될 필요는 없다.

문제 9. 분석 과제 관리 프로세스는 크게 과제 발굴과 (1) 및 모니터링으로 나누어진다. 분석 아이디어와 분석 과제가 확정이 되면 팀을 구성하고 (2) 하고 분석과제 진행 관리 및 결과를 공유하고 개선하는 절차를 수행한다.
 (1) 과제 수행
 (2) 분석 과제 실행

[3과목 데이터 분석]

문제 1. 두 집단의 분산이 같은지를 검정할 때 사용되는 검정 통계량은 어떤 분포를 활용하는 것이 가장 적절한가?
 1) t-분포
 2) F-분포
 3) Z-분포
 4) 이항분포
* 검정통계량? 통계적 가설을 검정할 목적으로 사용되는 통계량
* t 검정은 모분산을 모를 때, 표본 크기가 충분히 크지 않을 때 사용한다.

문제 2. 다음 중 변수의 측정수준에 따라 집중경향치와 산포도에 관한 설명으로 틀린 것은?
 1) 중앙값은 대표정인 집중경향치로 단점으로는 이상값 및 다른 관측값에 의해 영향을 민감하다는 단점이 있다.
 2) 최빈값은 지지하는 정당이나 좋아하는 숫자 등 수가 없거나 수가 있더라도 대소관계가 의미없는 질적자료에서 많이 쓰인다.
 3) 표본평균은 데이터의 총 개수로 나눈 값을 의미한다.
 4) 분위수는 관측값의 크기순으로 정렬된 데이터를 균등하게 나눈 값을 의미한다.

문제 26. 오분류표를 이용하여 특이도 값을 구하면?

* Specificity(특이도)  : 실제 불량품 중 예측 불량품
* Precision(정밀도) : 예측정품 중 실제 정품
* Recall,Sensitivity(재현율,민감도) : 실제 정품 중 예측 정품
* Accuracy(정확도) : 실제 맞은 비율

문제 30. 연관분석을 수행하기 위해 빈발 아이템 집합과 연관규칙이라고 하는 두 가지 형태로 표현하는 연관성 분석을 수행하는 대표적인 알고리즘을 무엇이라 하는가?

- 답 : apriori

* Apriori ;연관규칙으로, 특정 사건이 발생하였을 때 함께(빈번하게) 발생하는 또 다른 사건의 규칙

728x90
반응형