import
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_squared_error
import pandas as pd
X, y
X =
y =
train_test_split
X_train, X_test, y_train, y_test =train_test_split(X,y,test_size=0.2,random_state=123)
MinMaxScaler()
scaler = MinMaxScaler()
x_train_scaler = scaler.fit_transform(X_train)
x_test_scaler = scaler.transform(X_test)
KNeighborsRegressor
model_knn = KNeighborsRegressor(n_neighbors=3)
model_knn.fit(x_train_scaler, y_train)
y_pred = model_knn.predict(x_test_scaler)
mean_squared_error(y_test, y_pred)
MSE -> 예측값과 실제값의 차이를 제곱한 값을 평균한 값, 모델의 예측 정확도를 측정하는 지표, 값이 낮을 수록 모델의 성능이 높다.
728x90
'Software Development > Data Science' 카테고리의 다른 글
Python KMeans 기본동작 *실루엣계수 (0) | 2023.04.18 |
---|---|
명목형 변수의 One Hot Encoding + 합치기 (0) | 2023.04.16 |
수학문제-확률과 통계 (0) | 2023.04.15 |
로지스틱 회귀함수 (2) | 2023.04.14 |
Python RandomForestRegressor (0) | 2023.04.13 |