2023/03 30

2023 완독 12 - 구의 증명, 최진영

완독 12 구의 증명, 최진영 p64. 처음 만났을 때, 구와 나는 다른 조각으로 떨어져 있었다. 함께 하던 어느 날 구와 나 사이에 끈기 있고 질펀한 감정 한 방울이 똑 떨어졌다. 우리의 모난 부분을 메워주는 퍼즐처럼, 뼈와 뼈 사이의 연골처럼, 그것은 아주 서서히 자라며 구와 나의 모나고 모자란 부분에 제 몸을 맞춰가다 어느 날 딱 맞아떨어지게 된 것이다. 딱 맞아떨어지며 그런 소리를 낸 것이다. p69 참기 싫다고. 참는 게, 싫어졌다고. 나한테 묻지 말라고. 내가 뭘 알겠느냐고. 난 정말 열심히 살고 있다고. 근데 여긴 열심히 사는 게 정답이 아닌 세상 아니냐고. 나보다 오래 살았지만 어른 같지는 않은 누나에게, 소리를 지르며 화를 내버렸다. p70 그런데, 그러고 나면 그럴듯한 직장에 들어갈 수..

취미/책 2023.03.27

DataScience - 비계층적 군집분석

K-means 1. k-means 군집분석의 특징 - 임의의 k개의 점을 기반으로 가까운 거리의 데이터를 묶는 것과 더불어 평균을 활용하는 군집분석 기법 - 군집 개수(k)를 확정하기 위해 여러 번의 시행착오 필요 - 결과 고정을 위해 seed 설정 필요 2. 주요 함수 및 메서드 소개 sklearn - MinMaxScaler() - MinMax 정규화를 실시하는 sklearn의 함수 - fit()메서드로 규칙 모델을 만들고 transform()함수로 변환 실시 sklearn - StandardScaler() - 표준화를 실시하는 sklearn의 함수 - fit() 메서드로 규칙 모델을 만들고 transform()함수로 변환을 실시 sklearn - KMeans() - k-means 군집분석을 실시하는 ..

개발/Data Science 2023.03.27

Data Science - 상관분석

1. 상관분석 개요 - 두 변수의 선형관계를 확인하기 위해서 상관분석을 실시 - 두 수치형 변수의 비교는 Pearson's Correlation Coefficient를 확ㅇ니하며 그 외 다양한 상관계수 존재 - 상관계수가 0에 가까울수록 선형관계가 약하며, 절대값이 1에 가까울수록 선형관계가 강함 2. 다양한 상관 분석 Quantitiative Ordinal Nominal Quantitiative Pearson's Biserial Point Biserial Ordinal Biserial Spearman/Kendall Rank Biserial Nominal Point Biserial Rank Biserial Phi, L, C Lambda 3. 주요 함수 및 메서드 소개 pandas - corr() - pa..

개발/Data Science 2023.03.26

Data Science - 파생변수

파생변수 - 기존 변수를 조합하여 만들어내는 새로운 변수 파생 변수의 예시 - 기온, 습도, 풍속을 조합하여 만든 체감온도 변수 - 물건 주문 건수와 환불 건수를 조합하여 만든 환불 비율 변수 - 기존 방문 매장 정보를 활용한 주 방문 매장 변수 주요 함수 numpy - where() - 조건에 따라 두 개의 출력을 내는 함수 - if()함수를 대체할 수 있으며 조건, True일 때 반환값, False일 때 반환값을 차례대로 기입 pandas - rename() - 데이터프레임의 변수명을 변경할 때 사용하는 메서드 - columns 인자에 기존 변수명과 신규 변수명의 쌍을 딕셔너리로 구성하여 입력. pandas - apply() - row 또는 column 방향으로 일괄 계산하는 메서드 - axis 인자..

개발/Data Science 2023.03.25

Data Science - 이상치 & 결측치

1. 이상치 - 이상치 : 중심 경향성에서 멀리 떨어진 값 - 이상치의 처리 방법 1) 이상치 처리에 절대적인 기준은 없음 2) 대표적으로 Carling, Tukey 방법이 존재 3) 분포 기반으로 처리도 가능 2. 결측치 - 결측치 : 갑싱 기록되지 않고 비어있음 - 결측치의 처리 방법 1) 결측치 처리에 절대적인 기준은 없음 2) 단순 제거와 특정 값으로 대체하는 방식이 있음 3) 분석 데이터에서 결측치가 차지하는 비중이 낮은 경우 단순 제거하는 경우가 많음 3. 판다스 함수 - pandas - isna(), iusnull() 1) 결측치 원소를 True, 관측치를 False로 반환하는 메소드 2) 반대의 기능을 하는 메서드는 notna()와 notnull() - pandas - fillna() 1)..

개발/Data Science 2023.03.24

빠르게 실패하기, 에필로그

에필로그 성공 그리고 즐거움과 행복의 답을 우리는 ‘작은 행동’에서 찾았다 1. 즐거움의 요소를 잊지 말자 Remember the Fun Factor 이 책을 통해 삶을 즐거움으로 채워나가는 것의 중요성을 강조했다. 자신이 즐거움을 느끼는 일을 하면 모든 것에 좀 더 감사하는 마음을 갖게 된다. 창의적인 생각을 하게 되고 일도 더 생산성 있게 하게 된다. 또한 기대하지 못한 기회들도 적극 활용하게 된다. 그러니 오늘부터 시작하라. 그야말로 즐거운 시간을 보내라. 책을 읽거나 마사지를 받거나 아주 맛있는 점심을 먹거나 친구와 수다를 떨어보라. 2. 가능한 한 빨리 어떤 일이든 실패하고 망쳐보라! Do It Badly as Fast as You Can 성공하는 사람은 어떤 일을 망쳐보는 데 나름의 요령이 있..

취미/책 2023.03.20

2023 완독 11 - 빠르게 실패하기, 존 크럼볼츠

P38. 사람들은 바쁘다거나 준비가 덜 됐다는 이유로 ‘그 일’을 시작할 수 없다고 합리화한다. 몇 가지 문제가 해결될 때까지 기다리며 시작을 미룬 것이다. 나는 그에게 지금이라도 그림 그리기를 시작해보라고 권했다. 거창한 계획부터 세우지 말고 화실에서 그림을 배우거나 미술 동호회에 가입해 활동하는 것 같은, 지금 바로 시작할 수 있는 작은 방법을 찾아보라고 권했다. 어느 새 에릭은 원래의 전도유망한 청년이 되어 어쩌면 진로를 바꾸게 될지 모르는 또 다른 새로운 꿈을 향해 작은 행동들을 차곡차곡 쌓아가고 있었다. P40. 분명한 사실은 성공한 대부분의 사람이 계획을 세우는 데 시간을 쓰기보다 행동하는데 주력했다는 점이다. P44. 즐거움이 있는 곳을 찾으세요. 그러면 즐거움이 고통마저 녹여내릴 테니까요...

취미/책 2023.03.19

ADsP 생각 잘 안나는 단답형 정리

[1과목] 1. 인공 지능의 하위 범주로, 컴퓨터가 패턴 인식 작업을 개발하는 프로세스 또는 특정 프로그래밍 없이도 컴퓨터가 지속적으로 학습하고 데이터를 기반으로 예측하여 필요한 작업을 수행하는 능력을 의미하는 용어를 무엇이라 하는가? * 데이터 모델의 매개 변수를 자동으로 학습한다. * 훈련 데이터에서 최적의 매개변수를 찾고 시험 데이터를 사용해 모델의 실력을 평가한다. 2. 조직이나 기업의 인적 자원이 축적하고 있는 개별적인 지식을 체계화하여 공유함으로써 경쟁력을 향상시키기 위한 기업 정보시스템을 무엇이라 하는가? 3. 빅데이터 환경에서는 논리적인 (1) 분석 뿐만 아니라 (2) 또는 연관분석을 통하여 다양한 문제해결에 도움을 받을 수 있다. 즉 (1) 로부터 (2) 분석으로의 이동이 빅데이터 분석의..

개발/Data Science 2023.03.16
반응형