개발/Data Science

DataScience - 비계층적 군집분석

huiyu 2023. 3. 27. 06:03

K-means

1. k-means 군집분석의 특징
 - 임의의 k개의 점을 기반으로 가까운 거리의 데이터를 묶는 것과 더불어 평균을 활용하는 군집분석 기법
 - 군집 개수(k)를 확정하기 위해 여러 번의 시행착오 필요
 - 결과 고정을 위해 seed 설정 필요

2. 주요 함수 및 메서드 소개
  sklearn - MinMaxScaler()
  - MinMax 정규화를 실시하는 sklearn의 함수
  - fit()메서드로 규칙 모델을 만들고 transform()함수로 변환 실시

  sklearn - StandardScaler()
  - 표준화를 실시하는 sklearn의 함수
  - fit() 메서드로 규칙 모델을 만들고 transform()함수로 변환을 실시

 sklearn - KMeans()
  - k-means 군집분석을 실시하는 sklearn의 함수
  - n_clusters, max_iter, random_state에 각각 군집 개수, 최대 반복 연산, 결과 고정 설정 가능
  - KMeans()함수의 fit() 메서드에 데이터를 할당하여 학습 진행
  - 결과 객체의 cluster_centers_와 labels_ 어트리뷰트로 군집 중심과 각 행의 군집 번호 확인 가능

 

 

728x90
반응형

'개발 > Data Science' 카테고리의 다른 글

통계 : 확률 & 베이즈 정리  (0) 2023.04.03
통계분석 : 위치 & 변이 통계량  (0) 2023.04.02
Data Science - 상관분석  (1) 2023.03.26
Data Science - 파생변수  (0) 2023.03.25
Data Science - 이상치 & 결측치  (0) 2023.03.24