K-means
1. k-means 군집분석의 특징
- 임의의 k개의 점을 기반으로 가까운 거리의 데이터를 묶는 것과 더불어 평균을 활용하는 군집분석 기법
- 군집 개수(k)를 확정하기 위해 여러 번의 시행착오 필요
- 결과 고정을 위해 seed 설정 필요
2. 주요 함수 및 메서드 소개
sklearn - MinMaxScaler()
- MinMax 정규화를 실시하는 sklearn의 함수
- fit()메서드로 규칙 모델을 만들고 transform()함수로 변환 실시
sklearn - StandardScaler()
- 표준화를 실시하는 sklearn의 함수
- fit() 메서드로 규칙 모델을 만들고 transform()함수로 변환을 실시
sklearn - KMeans()
- k-means 군집분석을 실시하는 sklearn의 함수
- n_clusters, max_iter, random_state에 각각 군집 개수, 최대 반복 연산, 결과 고정 설정 가능
- KMeans()함수의 fit() 메서드에 데이터를 할당하여 학습 진행
- 결과 객체의 cluster_centers_와 labels_ 어트리뷰트로 군집 중심과 각 행의 군집 번호 확인 가능
728x90
'Software Development > Data Science' 카테고리의 다른 글
통계 : 확률 & 베이즈 정리 (0) | 2023.04.03 |
---|---|
통계분석 : 위치 & 변이 통계량 (0) | 2023.04.02 |
Data Science - 상관분석 (1) | 2023.03.26 |
Data Science - 파생변수 (0) | 2023.03.25 |
Data Science - 이상치 & 결측치 (0) | 2023.03.24 |