명목형 변수의 One Hot Encoding + 합치기

Software Development/Data Science

명목형 변수의 One Hot Encoding + 합치기

huiyu 2023. 4. 16. 06:14

1. get_dummies()

df_dum = pd.get_dummies(df_obj)
df_dum

2. One-Hot Encoder

from sklearn.preprocessing import OneHotEncoder

ohe = OneHotEncoder(handle_unknown='ignore')

#명목형만 빼서,
X_train_obj = ohe.fit_transform(X_train[col_cate])
X_test_obj = ohe.transform(X_test[col_cate])

3. One-Hot Encoding 적용 후 합치기

(1) concat 사용

X = pd.concat([df_screen_rem, df_dum], axis=1)

(2) sparse 사용

from scipy import sparse

#h기준으로 합치기, train + test 둘다.
X_train = sparse.hstack([X_train_cate, X_train_num]) 
X_test = sparse.hstack([X_test_cate, X_test_num])

일단 쉬운 방법 하나만 익혀두기, get_dummies() + concat() 동작.

728x90

'Software Development > Data Science' 카테고리의 다른 글

Python KMeans 기본동작 *실루엣계수 (0)	2023.04.18
Python kNN : KNeighborsRegressor 기초 동작 (0)	2023.04.17
수학문제-확률과 통계 (0)	2023.04.15
로지스틱 회귀함수 (2)	2023.04.14
Python RandomForestRegressor (0)	2023.04.13

현재글명목형 변수의 One Hot Encoding + 합치기

huiyu's blog

매일 기록하기 - 개발, 운동, 마라톤, 책, 영화, 여행

타이젠, WPF, 도트찍기, 읽다, 알고리즘, 운동기록, Unity, OpenGL, 운동, 업무기록, 한식조리사, Tizen, C++, 쓰다, 운동일지, 실기준비, 매일기록, c#, 설치, 마라톤,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

huiyu's blog

명목형 변수의 One Hot Encoding + 합치기

'Software Development > Data Science' 카테고리의 다른 글

'Software Development/Data Science'의 다른글

티스토리툴바

명목형 변수의 One Hot Encoding + 합치기

'Software Development > Data Science' 카테고리의 다른 글

'Software Development/Data Science'의 다른글

관련글

티스토리툴바