재미있게 알아보는 AI 키워드 70 - 빅데이터와 인공지능의 예측
27. 데이터마이닝 (Data mining)
- 축적된 데이터를 읽어 데이터 분석기술을 이용해 숨겨진 특성을 밝혀내는 것
- 인터넷의 대중화와 함께 방대한 정보가 쌓이며 주목, 방대한 데이터에서 의미있는 정보를 추출할 수 있는 기술이 필요
28. 협업필터링(Collaborative filtering)
- 데이터 마이닝 기술의 하나로 특히 사용자 데이터 분석 기법으로 주목
- 인터넷 쇼핑 사이트 등에 있는 '추천 시스템'은 이 기법을 사용.
- 사용자의 선호도는 해당 사용자의 현재까지 행동 이력을 통해 추측, 만약 해당 사용자에 대한 데이터가 없더라도 전체 사용자 데이터로부터 비슷한 사용자를 찾아 그 사용자의 구매이력을 통해 추측할 수 도 있다.
--> 사용자 데이터 안에서 비슷한 데이터를 찾아내서 예측하고 추천하는 방법을 협업필터링이라고 한다.
29. 검색 알고리즘
- 주어진 데이터 내 원하는 데이터를 찾는 기법
30. 최고 우선 탐색(best-first search)
- 검색 알고리즘의 효율은 어떤 순서로 데이터를 검색하는지 결정
- 너비 우선탐색 및 깊이 우선탐색 등을 사용
*검색 알고리즘은 검색한 데이터와 검색하지 않은 데이터의 경계에서 어떤 데이터를 우선해야 할 지 정해야 하는 문제에 봉착하게 된다.
깊이우선이라면 첫 데이터로부터 멀리(깊이) 떨어져 있는 것을 우선으로 하며, 너비 우선이라면 가까이 있는 것을 우선으로 하여 검색한다.
->여기에 데이터 위치와 내용에 기반한 자체 평가식을 도입하여 검색 순서를 새롭게 지정할 수 도 있는데, 이를 최고 우선 탐색이라 한다.
31. 클라우드상의 인공지능
- 클라우드란 인터넷상의 거대한 저장소와 이를 바탕으로 하는 강력한 계산 리소스를 가진다. 물리적인 실체라기보다 추상화된 계산 리소스, 메모리 리소스를 의미
- 다양한 정보를 수집하여, 실시간 데이터베이스에 저장하고 해석. 이런 데이터를 추출하고 분석해 서비스나 고객지원 제공
32. 스파스 모델링 / 스파스 코딩(sparse)
- sparse : '드문, 듬성듬성한'. 스파스 모델링이란 데이터가 드물게 있다는 것을 전제로 모델링하거나 코딩하는 것
- 대상이 '드물다'라는 것은 보이는 것이 커 보여도 사실은 소수의 지배적인 요소가 대상을 채우고 있다는 것을 의미
- 예를들어 빅데이터가 아무리 크더라도 대부분 10차원의 데이터로 복원할 수 있다면 이는 드문드문하다고 볼 수 있다.
- 뇌의 정보 처리 방식은 뉴런이라는 신경세포로 구성, 뇌가 몇 개의 뉴런단위로 구성되어 있다고 단순화해서 생각한다면 뇌는 뉴런을 효율적으로 사용하고 있는 것이다. 이것도 스파스 모델링이라고 볼 수 있다.
- 정보를 가능한 한 소수의 요소로 표현하는 것을 스파스 코딩이라고 한다.
33. 마르코프 모델
- 확률과정이란 특정 상태에서 또 다른 상태로의 전이가 확률적으로 발생하는 과정을 말한다.
- 이 확률 과정 중 특히 다음 현상이 일어날 확률은 현재의 현상에만 의존한다는 제약을 모델에 적용한 것이 마르코프 모델이다. 이러한 성질을 마르코프 성질이라고 부르며 마르코프 성질을 가진 확률 과정을 마르코프 과정이라고 한다.
34. 은닉 마르코프 모델
- 확률 과정에서 각 대상의 직접 관측이 불가능하더라도 출력은 관측할 수 있는 경우가 있다. 이렇게 관측되지 않은 상태를 가진 마르코프 과정을 은닉 마르코프 과정이라고 한다.
- 예를 들어 주식의 가격의 경우, 변동 요소를 알 수 없지만 이 요소는 주가를 출력으로 하는 확률 분포를 가진다. 주가의 변동이라는 현상 뒤에는 그것을 출력하고 있는 감춰진 확률 과정이 있는 것이다. 이를 은닉 마르코프 모델이라고 한다. 각 요소의 직접적인 정체는 모르지만 출력을 알고 있으므로 거기서 실제 숨겨진 마르코프 모델을 찾는 것이다.
35. 베이즈의 정리 / 베이지안 네트워크
- 어떤 현상이 발생했을 때 원인이 되는 현상의 확률을 모델화한 것. 주로 사고가 발생했을 때 그 원인을 추적하는 방법으로 활용
- 베이지안 네트워크는 여러 현상 간 고나계를 좀 더 일반적인 그래프로 나타낸 것으로 화살표가 인과간께를 나타내고 화살표의 값이 사후 확률을 나타낸다.
재미있게 알아보는 AI 키워드 70 - 게임 속 인공지능
36. 게임 AI
- 게임이라는 한정된 상자 안에 인공지능을 넣어서 문제에 직면하게 만들고 이를 통해 인공지능을 진화시킨다. 이러한 분야를 게임 AI라고한다.
- 체스, 바둑, 장기 같은 '보드 게임 인공지능'
1) 특징 : 이산공간(격자가 구분되어있음), 이산 시간(턴 방식), 완전정보(모든 정보가 공개되어 있음)
2) 특정 시점의 게임 상태를 완전하게 기술 가능, 플레이어가 어떤 수를 선택하면 다음 게임 상태로 전이. 이때 게임 상태의 가능한 변화를 기술한 것이 게임트리이다.
3) 장기의 경우 가능한 수가 10의 220제곱, 바둑은 10의 360제곱이므로 모든상태를 고려하는것이 어렵다.
-> 승률이 높은 형세만 효율적으로 선택하는 '탐색', '형세 평가' 기술 필요. 과거의 기보를 학습시켜 정확도를 높일 수 있다.
-> 알파고의 경우 '한 수를 선택하면 그 뒤는 어느 정도 랜덤으로 게임을 반복해서 승률을 계산'하는 몬테카를로트리 탐색을 채택하여 발전
- 디지털 게임
1) 특징 : 연속 공간, 연속 시간, 불완전 정보
2) 게임 내 캐릭터는 자신의 주변상황을 '인식'해서 공격, 도주, 방어 등의 '의사 결정'을 하고 그에따라 움직이는 '행동 형성'이 이루어진다.
37. 워울프 AI
- 대화로만 구성된 불완전 정보 게임(플레이어가 게임의 정보를 불완전하게 알고 있는 게임)
- 워울프라고 해서 무슨게임인가 했는데 마피아게임같은 걸 말하는거같다. 마을진영vs늑대진영 나뉘어 서로가 누구인지 모른채 늑대를 찾는 심리게임
- 워울프AI는 이 게임의 플레이어 중 한명이 되어 게임에 참여하는 인공지능이다.
- 자연어처리, 대화 생성, 추론, 제스처 인식등 다양한 인공지능 과제 필요
38. 완전정보게임/불완전 정보게임
- 완전 정보 게임 : 게임의 전체 정보를 플레이어가 볼 수 있는 게임, 장기/체스/바둑 등
- 불완전 정보게임 : 플레이어 관점에서 게임의 일부 정보를 볼 수 없는 게임, 마작/트럼프/워울프 게임 등
- 인공지능의 게임 연구는 먼저 완전정보게임을 목표로 한다. 완전정보게임은 확실한 정보로부터 사고를 시작할 수 있는 특징.
- 불완전 정보 게임은 불확실한 지식에 기반한 추론이 필요. 확률에 기반한 사고
39. 게임이론 / 죄수의 딜레마
- 특정 사건에 대해 상대와의 협력과 대결 관계를 수리적으로 구하는 이론. 구조는 간단하지만 실용성 있는 결과를 도출해 경제학 분야를 중심으로 연구진행
- 죄인의 딜레마는 게임이론의 대표적인 모델, 특정 조건에서 두명의 죄인이 협력하는 것이 좋은 지 배신하는 것이 좋은지 수리적으로 판단한다.
자세한 조건은 백과사전 --> http://terms.naver.com/entry.nhn?docId=779583&cid=42085&categoryId=42085
40. 몬테카를로 트리 탐색(Monte Carlo Tree Search, MCTS)
- 몬테카를로 시뮬레이션은 난수를 이용한 시뮬레이션을 의미
- 몬테카를로 트리 탐색은 여러 선택안을 동일한 횟수로 시뮬레이션해서 각 선택안이 어느 정도 효용이 있는지 조사. 그 중 특히 효용이 있는 큰 것을 선택해 더 많은 시뮬레이션 횟수를 할당. 이때 사용하는 알고리즘이 UCB(Upper Confidence Bound)이다.
- 알파고 사용, 최근에는 실시간 전략 게임에서도 사용하는 등 게임 산업에서 적용하는 사례가 늘고 있다고 한다.
'일상 > 독서' 카테고리의 다른 글
[책리뷰]이것이 C언어다 - 서현우의 C프로그래밍 정복 (0) | 2018.04.14 |
---|---|
재미있게 알아보는 AI 키워드 70 - 나머지 키워드 (0) | 2018.02.14 |
재미있게 알아보는 AI 키워드 70 - 인간의 뇌를 닮은 인공지능 (0) | 2018.02.12 |
재미있게 알아보는 AI 키워드 70 - 인간을 넘어선 인공지능 (2) | 2018.02.11 |
[책리뷰] Hello Coding 쌩초보의 처음 프로그래밍 파이썬 (0) | 2018.02.10 |