개발/Data Science

데이터분석 준 전문가(ADsP) 기출 20회 오답

huiyu 2023. 3. 3. 06:35

[2과목] 데이터 분석 기획

문제 2. 프로젝트 위험 계획 수립 시 예상되는 위험에 대한 대응방법이 아닌 것은?
 1) 회피(Avoid)
 2) 전이(Transfer)
 3) 완화(Mitigate)
 4) 관리(Management)

문제 3. 하양식 접근방법의 데이터 분석기획 단계는?
 1) Problem discovery -> Problem Definition -> Solution Search ->  Fesaibilty Study

단답형 문제 10. 다음 빈 칸에 알맞은 용어는?
- 데이터 거버넌스에서 '데이터 저장소 관리'는 메타데이터 및 표준 데이터를 관리하기 위한 전사 차원의 저장소를 구성한다. 저장소는 데이터 관리 체계 지원을 위한 워크플로우 및 관리용 응용 소프트웨어를 지원하고 관리 대상 시스템과의 인터페이스를 통한 통제가 이루어져야 한다. 데이터 구조 변경에 따른 [      ]도 수행되어야 효율적인 활용이 가능하다.
 답 : 사전영향평가

[3과목] 데이터 분석

문제 9. 다음 중 오분류표의 평가지표 중 True로 예측한 관측치 중 실제 True인 지표를 무엇이라 하는가?
 - Precision

문제 10. 같은 모집단 내의 다른 데이터에 적용하는 경우에도 안정적인 결과를 제공하는 것을 의미하며 데이터를 확장하여 적용할 수 있는지에 대한 모형 평가 기준을 무엇이라 하는가?
 1) 일반화의 가능성
 2) 효율성
 3) 예측의 정확성
 4) 분류의 정확성

문제 11. 의사결정나무에서 이산형 목표변수는 지니지수, 연속형 목표변수는 분산 감소량을 사용하는 알고리즘은 무엇인가?
 1) CHAID
 2) CART
 3) C4.5
 4) C5.0

 문제 15. 다음 중 신용카드 고객 파산여부를 예측하는 모형이 아닌 것은?
 1) 로지스틱 회귀분석
 2) 선형회귀분석
 3) 의사결정나무
 4) 앙상블모형

* 선형회귀는 독립변수, 종속변수 모두 연속형일때 사용. 파산여부는 범주형 데이터

문제 19. 다음 중 주성분 분석에 설명 중 적절하지 않은 것은?
 1) 가장 분산이 작은 것을 제 1 주성분으로 설정한다.
 2) 주성분분석은 상관관계가 있는 변수들을 결합해 상관관계가 없는 변수로 분산을 극대화하는 변수로 선형결합을 해 변수를 축약하는데 사용하는 방법이다.
 3) 공분산행렬은 변수의 측정단위를 그대로를 반영한 것이고 상관행렬은 모든 변수의 측정단위를 표준화한 것이다.
 4) 공분산행렬을 이용한 분석의 경우 변수들의 측정단위에 민감하다.

문제22. 종속변수가 성공 또는 실패인 이항변수 되어 있을 때 종속변수와 독립 변수 간의 관계식을 이용하여 두 집단 또는 그 이상의 집단을 분류하고자 할 때 사용되는 분석기법을 무엇이라 하는가?
 1) 로지스틱 회귀 분석
 2) 다중 회귀분석
 3) 의사 결정 나무
 4) 앙상블 모형

단답형

문제 24. 다음은 음주와 비음주, 사고와 비사고 확률 분할표로 작성하였다. 다음 중 조건부확률 P(음주 | 사고)는 얼마인가?

  사고 무사고
음주자 0.07 0.23
비음주자 0.06 0.64

-> 0.07 / 0.13 = 0.54

문제 25. 다음 값은 얼마인가? P(A) = 0.3, P(B) = 0.4이며 서로 독립이다. P(B|A)?
답) 0.4
*A,B 서로 독립일 경우 P(B|A) = P(B) 성립.

문제 26. 다음은 어떤 군집방법에 대한 설명인가?
 - 두 군집 사이의 거리를 군집에서 하나씩 관측값을 뽑았을 때 나타날 수 있는 거리의 최소값으로 측정하며, 고립된 군집을 찾는데 중점을 둔 방법이다.
답) 최단연결법 또는 단일 연결법

문제 27. 회귀모형에 대한 가정에 대한 설명이다. 빈칸에 알맞은 용어는?
 - 잔차와 독립변수의 값이 관련되어 있지 않다 - 독립성
 - 잔차들끼리 상관이 없어야 한다. - 비상관성
 - () 이 정규분포를 이뤄야 한다. - 정상성
답) 잔차항

문제 28. 확률적 표본추출방법을 무엇이라 하는가?
 - 모집단을 성격에 따라 몇 개의 집단 또는 층으로 나누고, 각 집단 내에서 원하는 크기의 표본을 무작위로 추출하는 확률적 표본 추출 방법
답) 층화추출

문제 29. 다음 앙상블 기법을 무엇이라 하는가?
- 원 데이터 집합으로 크기가 같은 표본을 여러 번 단순 임의 복원 추출하여 각 표본에 대해 분류기를 생성하는 앙상블 기법답) 배깅

문제 30. 아래 보기가 설명하는 교차 검증 기법을 무엇이라 하는가?
- 주어진 원천 데이터를 랜덤하게 두 분류로 분하여 교차검정을 실시하는 방법으로 하나의 모형 학습 및 구축을 위한 훈련용 자료로 하나는 성과평가를 위한 검증용 자료로 사용하는 방법
답) 홀드아웃(Hold Out)

728x90
반응형