개발/Data Science

ADsP 생각 잘 안나는 단답형 정리

huiyu 2023. 3. 16. 07:09

[1과목]

1. 인공 지능의 하위 범주로, 컴퓨터가 패턴 인식 작업을 개발하는 프로세스 또는 특정 프로그래밍 없이도 컴퓨터가 지속적으로 학습하고 데이터를 기반으로 예측하여 필요한 작업을 수행하는 능력을 의미하는 용어를 무엇이라 하는가?
* 데이터 모델의 매개 변수를 자동으로 학습한다.
* 훈련 데이터에서 최적의 매개변수를 찾고 시험 데이터를 사용해 모델의 실력을 평가한다.

2. 조직이나 기업의 인적 자원이 축적하고 있는 개별적인 지식을 체계화하여 공유함으로써 경쟁력을 향상시키기 위한 기업 정보시스템을 무엇이라 하는가?

3. 빅데이터 환경에서는 논리적인 (1) 분석 뿐만 아니라 (2) 또는 연관분석을 통하여 다양한 문제해결에 도움을 받을 수 있다. 즉 (1) 로부터 (2) 분석으로의 이동이 빅데이터 분석의 주요 변화라고 할 수 있다.

4. 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화 시키기 위한 것이다. 자재구매 데이터, 생산/재고 데이터, 유통 판매 데이터, 고객 데이터로 구성된다.

[2과목]

1. 기업 및 공공기관에서는 시스템의 중장기 로드맵을 정의하기 위한 ()를 수행한다. ()는 정보기술 또는 정보시스템을 전략적으로 활용하기 위하여 조직 내/외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차이다.

2. 데이터 분석 도입의 수준을 파악하기 위한 분석 준비도의 6가지 구성 요소 중 하나로서 운영시스템 데이터 통합, 빅데이터 분석 환경, 통계분석 환경 등을 진단하는 구성요소는 무엇인가?

3. 데이터 거버넌스란 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등이 표준화된 관리 체계를 수립하고 운영을 위한 프레임 워크 및 저장소를 구축하는 것을 말한다.
 특히 (a), (b), (c)은 데이터 거버넌스의 중요한 관리 대상이다.

4. 비즈니스 모델 관점에서는 해당 기업의 사업 모델을 도식화한 비즈니스 모델 캔버스이 9가지 블록을 단순화 하여 (1), (2), 고객 단위로 문제를 발굴하고, 이를 관리하는 두 가지의 영역인 규제와 감사 영역과 (3) 영역에 대한 기회를 추가로 도출하는 작업을 수행한다.

5. 소프트웨어 개발 및 전산장비 운영 업체들의 업무 능력 및 조직의 성숙도를 평가하기 위한 모델을 무엇이라고 하는가?

6. 식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계이다. 앞서 수행한 문제탐색의 단계 무엇을 어떤 목적으로 수행해야하는지에 대한 관점이었다면 ( ) 단계에서는 이를 달성하기 위해 필요한 데이터 및 기법을 정의하기 위한 데이터 분석의 문제로의 변환을 수행하게 된다.

7. 데이터 분석 단계(Phase)의 어떤 Task에 대한 설명인가?
 - 분석용 데이터를 이용한 가설 설정을 통하여 통계 모델을 만들거나 기계학습을 이용한 데이터의 분류, 예측, 군집 등의 기능을 수행하는 과정을 의미한다.

8. 분석 과제 관리 프로세스는 크게 과제 발굴과 (1) 및 모니터링으로 나누어진다. 분석 아이디어와 분석 과제가 확정 되면 )(팀을 구성)하고 (2)하고 분석과제 진행 관리 및 결과를 공유하고 개선하는 절차를 수행한다.

9. 현재의 비즈니스 모델 및 유사, 동종사례 탐색을 통해서 빠짐없이 도출한 분석 기회들을 구체적인 과제로 만들기 전에 ()로 표기하는 것이 필요하다. 풀어야 할 문제에 대한 상세서명 및 해당 문제 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 ()를 활용하도록 한다.

10. 기존의 논리적인 단계별 접근법에 기반한 문제해결 방식은 최근 복잡하고 다양한 환경에서 발생하는 문제에는 적합하지 않을 수 있다. 이를 해결하기 위해 ( ) 접근법을 통해서 전통적인 분석적 사고를 극복하려 한다.
 - 이 접근법은 상향식 발산단계와 도출된 옵션을 분석하고 검증하는 하향식 접근 방식의 수렴 단계를 반복하여 과제를 발굴한다.

11. 데이터 거버넌스에서 데이터 저장소 관리는 메타데이터 및 표준 데이터를 관리하기 위한 전사 차원의 저장소를 구성한다. 저장소는 데이터 관리 체계 지원을 위한 워크플로우 및 관리용 응용 소프트웨어를 지원하고 관리 대상 시스템과의 인터페이스를 통한 통제가 이루어져야 한다. 데이터 구조 변경에 따른 []도 수행되어야 활용이 가능하다.

[3과목]

1. 베이즈 추론을 기반으로 한 방법론의 정확도는 일반적으로 머신러닝의 대표적인 방법인 랜덤 포레스트나 트리 분류 방법보다도 높다고 평가받고 있다. 베이지안 추론을 활용한 대표적 분류 방법 알고리즘은?

2. 아래 예시와 같이 텍스트마이닝의 전처리 과정 중에서 변형된 단어 형태에서 접사 등을 제거하고 그 단어의 원형 또는 어간을 찾아내는 것을 지칭하는 용어는 무엇인가?

3. 의사결정나무는 선형성, 정규성, 등분산성 등 수학적 가정이 필요없는 ( ) 모형이다.

4. 모집단의 성격에 따라 몇 개의 집단 또는 층으로 나누고, 각 집단 내에 원하는 크기의 표본을 무작위로 추출하는 표본 추출방법을 무엇이라 하는가?

5. 입력받은 값을 출력으로 0~1 사이의 값으로 모두 정규화하며 출력 값들의 총합은 항상 1이 되는 특징을 가진 활성화 함수는?

6. 연관분석을 수행하기 위해 빈발 아이템 집합과 연관규칙이라고 하는 두 가지 형태로 표현하는 연관성 분석을 수행하는대표적인 알고리즘을 무엇이라 하는가?

7. 각 데이터 포인트와 주위 데이터 포인트들과의 거리 계산을 통해 값을 구하며, 군집 안에 있는 데이터들은 잘 모여있는지, 군집끼리는 서로 잘 구분되는지 클러스터링을 평가하는 척도를 무엇이라하는가?

8. 주어진 원천 데이터를 랜덤하게 두 분류로 분리하여 교차 검정을 실시하는 방법으로 하나는 모형의 학습 및 구축을 위한 훈련용 자료로 하나는 성과 평가를 위한 검증용 자료로 사용하는 데이터 분할 방법을 무엇이라 하는가?

9. 평균으로부터 3*표준편차 밖의 값들을 이상치 탐색하는 알고리즘을 무엇이라 하는가?

10. 개체들 사이의 유사성 및 비유사성을 측정하여 2차원 또는 3차원 공간상에 점으로 표현하는 분석 방법을 무엇이라 하는가?

11. 잔차항이 정규분포를 이뤄야한다는 회귀모형에 대한 가정을 무엇이라 하는가?
 - 잔차와 독립변수의 값이 관련되어 있지 않다 : 독립성
 - 잔차들끼리 상관이 없어야 한다 : 비상관성
 - ()이 정규분포를 이뤄야 한다 : 정상성

[1과목]
1. 머신러닝
2. KMS(지식 관리 시스템)
3. 인과관계, 상관관계*1과목에서 두개 키워드일때 이거인지고민
4. SCM

[2과목]
1. 전보전략계획(ISP)
2. IT 인프라
3. 마스터데이터, 메타 데이터, 데이터 사전
4. 업무, 제품, 지원인프라
5. 능력 성숙도 평가 모델
6. 문제 정의
7. 모델링
8. 과제 수행, 분석과제 실행
9. 분석 유즈케이스
10. 디자인 씽킹
11. 사전영향평가

[3과목]
1. 나이브 베이즈 분류
2. 스태밍
3. 비모수적
4. 층화추출
5. 소프트맥스
 * 시그모이드 : 둘 중 하나로 분류할 경우 하나의 입력을 로지스틱 함수에 넣어 하나의 출력을 얻는다. 이 출력은 0~1사이의 값이므로 둘 중 어느 한 쪽일 확률로 해석한다.
 * 소프트맥스 : 여러 개 중의 하나로 분류할 경우에는 카테고리와 같은 수의 입력을 소프트맥스 함수에 넣는다. 각각의 출력은 0~1사이이며, 모두 더하면 1이 되므로 출력을 각 카테고리에 해당하는 확률로 해석한다.
* 여러개다! ->소프트맥스, 1개다->시그모이드
6. apriori
7. 실루엣 계수
8. 홀드 아웃
9. ESD 알고리즘
10. 다차원척도법
  *SOM과 구분 : 대뇌피질의 시각피질을 모델화한 인공신경망의 일종으로 비지도 학습에 의한 클러스터링 방법
11. 정상성

* 알아둘 것!
 시계열 분석 조건
 1) 평균이 일정하다
 2) 분산이 시점에 의존하지 않는다.
 3) 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다.
 -> 정상성

특이도&민감도->ROC Curve
- X축 : 특이도 / Y축 : 민감도

SOM Process에서 입력 벡터와 경쟁층 노드간의 유클리드 거리를 계산하여 그중 제일 가까운 뉴런은? BMU

728x90
반응형