DataScience - 비계층적 군집분석

개발/Data Science

DataScience - 비계층적 군집분석

huiyu 2023. 3. 27. 06:03

K-means

1. k-means 군집분석의 특징
- 임의의 k개의 점을 기반으로 가까운 거리의 데이터를 묶는 것과 더불어 평균을 활용하는 군집분석 기법
- 군집 개수(k)를 확정하기 위해 여러 번의 시행착오 필요
- 결과 고정을 위해 seed 설정 필요

2. 주요 함수 및 메서드 소개
sklearn - MinMaxScaler()
- MinMax 정규화를 실시하는 sklearn의 함수
- fit()메서드로 규칙 모델을 만들고 transform()함수로 변환 실시

sklearn - StandardScaler()
- 표준화를 실시하는 sklearn의 함수
- fit() 메서드로 규칙 모델을 만들고 transform()함수로 변환을 실시

sklearn - KMeans()
- k-means 군집분석을 실시하는 sklearn의 함수
- n_clusters, max_iter, random_state에 각각 군집 개수, 최대 반복 연산, 결과 고정 설정 가능
- KMeans()함수의 fit() 메서드에 데이터를 할당하여 학습 진행
- 결과 객체의 cluster_centers_와 labels_ 어트리뷰트로 군집 중심과 각 행의 군집 번호 확인 가능

728x90

'개발 > Data Science' 카테고리의 다른 글

통계 : 확률 & 베이즈 정리 (0)	2023.04.03
통계분석 : 위치 & 변이 통계량 (0)	2023.04.02
Data Science - 상관분석 (1)	2023.03.26
Data Science - 파생변수 (0)	2023.03.25
Data Science - 이상치 & 결측치 (0)	2023.03.24

현재글DataScience - 비계층적 군집분석

Today :
Yesterday :

설치, 업무기록, 마라톤, Tizen, Unity, 한식조리사, WPF, 운동, 알고리즘, c#, 도트찍기, OpenGL, 읽다, 타이젠, 매일기록, 실기준비, 운동일지, 쓰다, 운동기록, C++,

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

huiyu's blog