개발/Data Science

데이터분석 준 전문가(ADsP) 기출 23회 오답

huiyu 2023. 3. 6. 06:12

[2과목 데이터 분석 기획]

문제 3) 빅데이터 거버넌스와 비교할 떄 데이터 거버넌스와 차이점에 해당하지 않는 것은?
 1) 데이터 생명 주기 관리
 2) 데이터 백업 주기 변경
 3) 개인정보보호 및 보안
 4) 데이터 품질기준, 변경관리

문제 9) 분석 수준 진단 방법 중 조직의 분석 및 활용을 위한 역량 수준을 파악하기 위해 도입->(  ) -> 확산 -> 최적화의 분석 성숙도 단계 포지셔닝을 파악하게 된다. 빈칸에 알맞은 용어는?
 - 활용

문제 10) 다음 보기 빈칸에 공통으로 들어갈 알맞은 용어는?
 - 현재의 비즈니스 모델 및 유사, 동종사례 탐색을 통해서 빠짐없이 도출한 분석 기회들을 구체적인 과제로 만들기 전에 (  ) 로 표기하는 것이 필요하다. 풀어야 할 문제에 대한 상세서명 및 해당 문제 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 (  ) 를 활용하도록 한다.
 - 분석 유즈 케이스

[3과목] 데이터 분석

문제 2) 다음 중 이산형 확률분포가 아닌 것은?
 1) 이항 분포
 2) 포아송 분포
 3) 기하 분포
 4) 지수 분포

문제 4) 이상치(outlier)를 판별하는 방법에 대한 설명 중 가장 적절하지 않는 것은?
 1) 평균 3 * 표준 편차를 벗어나는 값은 이상치로 판단하고 제거한다.
 2) IQR = Q3 - Q1이라 할 때 Q3 + 1.5*IQR, Q1 - 1.5*IQR 범위를 벗어나는 값을 이상치로 판단한다.
 3) 이상치는 변수의 분포에서 벗어난 값으로 상자 그림을 통해 확인할 수 있다.
 4) 이상치는 분포를 왜곡할 수 있으나 실제 오류인지 통계적으로 검증할 수 없으므로 제거 여부는 해당 분야의 전문가와 상의하여 판별하여야 한다.

* 무조건 제거하면 안된다. 이상치의 특성을 파악해야 한다.

문제 9) 다음 중 EM 알고리즘의 진행 과정 중 임의의 파라미터 값을 정한 후, Z의 기대치를 계산하는 단계를 무엇이라 하는가?
 1) E - step
 2) M - step
 3) 임의의 파라미터 추정단계
 4) 잠재변수 도입 단계

문제 12) 부스팅(Boosting) 알고리즘 중 Leaf-wise-node 방법을 사용하는 알고리즘은 무엇이라 하는가?
 1) AdaBoost
 2) GBM
 3) XGboost
 4) Light GBM

*Light GBM이 다른 알고리즘과의 차이점은 각 노드는 root 노드와 가까운 노드를 우선 순회, 수평 성장 하는 Level wise, 그러나 Light GBM는 loss 변화가 큰 노드에서 데이터를 분할하여 수직성장함 즉 Leaf-wise tree를 사용한다.

문제 17) 다음 중 분해 시계열 요인에 해당하지 않은 것은?
 1) 추세 요인
 2) 계절 요인
 3) 불규칙 요인
 4) 정상요인

문제 21) 비모수적 검정의 특징으로 부적절한 것은?
 1) 절대적인 크기가 중요하므로 평균, 분산, 등을 이용해 검정을 실시한다.
 2) 추론에서 계산이 모수적 방법보다 훨씬 단순하다.
 3) 통계량이 부호(sign) 혹은 순서(rank)에 의해 계산되므로 이상치(outlier)에 영향을 크게 받지 않는다.
 4) 비모수적 검정은 모수 자체보다는 분포형태에 관한 검정을 실시한다.

* 비모수적 검정은 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우에 이용된다.

문제 25) 각 데이터 포인트와 주위 데이터 포인트들과의 거리 계산을 통해 값을 구하며, 군집 안에 있는 데이터들은 잘 모여있는지, 군집끼리는 서로 잘 구분되는지 클러스터링을 평가하는 척도를 무엇이라 하는가?
 - 실루엣 계수

문제 27) 동전을 3개를 동시에 던져서 앞면이 한번 나올 확률은?
 모든 경우의 수 = 2*2*2
 앞이 나올 경우 = 3(앞뒤뒤, 뒤앞뒤,뒤뒤앞)
 -> 3/8

 

728x90
반응형