개발 321

[Backend] AWS 초기설정

1. 인스턴트 시작 Ubuntu로 설정후 생성 키페어 생성 후 설정 스토리지 같은 경우 기본 옵션 설정 후 시작 2. 고정 IP 사용하기: 탄력적 IP 설정 -네트워크 및 보안 > 탄력적 IP 설정 작업>탄력적 IP 연결 후 생성한 인스턴스 연결 3. Putty로 세팅한 고정 IP로 연결 putty를 연결한 WinScp 실행. 호스트 이름에 설정한 고정 IP, 사용자 이름에 ubuntu, 비밀번호에 인스턴스 생성 시 만든 키파일을 선택하여 입력한다. 키파일은 고급>SSH>인증에서 개인키 파일을 선택하여 설정. 4. Ubuntu 서버 터미널 설정 WinSCP에서 모니터번개 모양(putty 연결) 을 선택한다. 콘솔에서 root권한 변경 >sudo su apt upate >apt-get update ngix..

개발/Linux 2023.12.20

비전공자 ADsP(데이터분석 준 전문가) 합격 후기

지난 2월, 1분기 목표였던 ADsP 시험!! 후기를 남겨야지 생각만하고 벌써 3달이 지났다. 벌써 기억이 가물가물해졌지만.. 기억을 살려서 남겨보는 후기. - ADsP는 왜? 사실 나한테 직접적으로 필요한 자격증은 아니다. 개발자로 10년정도 일을 하고 있지만 관련 전공을 나오지도 않았으며, 관련 업무를 하고 있는 것도 아니다. 그렇다고 ADsP를 딴다고 해서 바로 이 직무를 한다거나 내 업무에 도움되는 것도 아니긴 하다. 다만 2월에 시간이 남아 돌기도 했고... 뭐 따두면 나쁠거 없지란 생각이 있었다. ADsP의 경우에는 데이터 분석 관련해서 공부를 하게 되는데 기초적인 지식을 쌓아두기에도 괜찮을거란 생각에 공부했다. 회사에서 데이터 사이언스 관련 직무 교육이나 자격 검정 시험도 시작했는데 그 이전..

개발/Data Science 2023.05.07

명목형 변수의 One Hot Encoding + 합치기

1. get_dummies() df_dum = pd.get_dummies(df_obj) df_dum 2. One-Hot Encoder from sklearn.preprocessing import OneHotEncoder ohe = OneHotEncoder(handle_unknown='ignore') #명목형만 빼서, X_train_obj = ohe.fit_transform(X_train[col_cate]) X_test_obj = ohe.transform(X_test[col_cate]) 3. One-Hot Encoding 적용 후 합치기 (1) concat 사용 X = pd.concat([df_screen_rem, df_dum], axis=1) (2) sparse 사용 from scipy import sp..

개발/Data Science 2023.04.16

수학문제-확률과 통계

Q1. 눈이 1부터 6까지 있는 주사위를 두 번 던질 때 나오는 수 중 3의 배수가 존재할 확률은? -> 1 - (3배수가 나오지 않을 확률 x 3배수가 나오지 않을 확률) = 1 - (4/6) x (4/6) = 1 - (16/36) = 20/36 = 5/9 Q2. 주사위를 5회 던졌다고 가정했을 때 주사위의 숫자 중 관심있는 숫자 5가 3회 이상 나타날 확률은? (소수 세째자리) *이항분포의 확률 공식 P(X) = (n,k)p^x(1-p)^n-x (n,k) = nCk => n개중 k개를 고르는 경우의 수 = n! / k!(n-k)! *파이썬을 이용하기 1) 팩토리얼도 파이썬으로 import math math.factorial(5) / (math.factorial(5) * math.factorial(0)..

개발/Data Science 2023.04.15

Python RandomForestRegressor

1. import RandomForestRegressor from sklearn.ensemble import RandomForestRegressor 2. 모델 생성 model = RandomForestRegressor() 3. 모델 학습 : fit model.fit(x_train, y_train) 4. 모델 검증 print(model.score(x_train, y_train)) print(model.score(x_test, y_test)) 5. 모델 예측 y_predict = model.predict(x_test) print(y_predict[0]) 6. 피쳐 중요도 확인 model.feature_importances_ ->feature_importances : 결정트리에서 노드를 분기할 때, 해당 피쳐..

개발/Data Science 2023.04.13

python 함수 소소한 메모

변수명 재설정 : rename df1 = df1.rename(columns={'old_name':'new_name'}) df1 원하는 columns만 추출 col_name = ['A', 'B','C'] df1[col_name] apply 와 applymap ->lambda적용시 apply는 Series를 적용 합치기 concat, df의 'A', 'B' column을 df_origin의 'Res'와 합치기 df_result = pd.concat([df[['A','B']], df_origin['Res']], axis=1) df_result 'A' 값이 1인 'Res'의 평균, 'B'값이 1인 'Res'의 평균 mean_A = df_result.loc[df_result['A']==1,'Res'].mean()..

개발/Data Science 2023.04.12

Python - lambda & 정규표현식 기초

python def 함수 def is_ABC(x): if(x=='ABC'): return 1 else: return 0 df['is_ABC'] = df['ABC'].apply(is_ABC) if: elif: else: lambda로 변경 df['is_ABC'] = df['ABC'].apply(lambda x: 1 if x=='ABC' else 0) ABC인경우 1, DEF인경우 2, 나머지 3인경우로 바꾸기 df['is_ABC'] = df['ABC'].apply(lambda x: 1 if x=='ABC' else (2 if x=='DEF' else 3)) df 정규표현식 import re #휴대폰 번호 추출 pattern = re.compile("010-[0-9]{4}-[0-9]{4}") pattern...

개발/Data Science 2023.04.11
반응형