AI study

파이썬 머신러닝 완벽 가이드 - 8. Clustering(2) (평균 이동, GMM, DBSCAN, 예제 실습)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 8. Clustering(2) (평균 이동, GMM, DBSCAN, 예제 실습) : K-평균과 유사하게, 군집의 중심을 지속적으로 움직이면서 군집화를 수행함: 그러나, K-평균이 중심에 소속된 데이터의 평균 거리 중심으로 이동하는데 반해,: 평균 이동은 데이터가 모여있는 velog.io 4. 평균 이동 Mean shift : K-평균과 유사하게, 군집의 중심을 지속적으로 움직이면서 군집화를 수행함 : 그러나, K-평균이 중심에 소속된 데이터의 평균 거리 중심으로 이동하는데 반해, : 평균 이동은 데이터가 모여있는 밀도가 가장 높은 곳..

파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(1) (PCA, LDA)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(1) (PCA, LDA) : 매우 많은 피처로 구성된 다차원 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것다차원 데이터 세트의 문제점차원이 증가할 수록 데이터 포인트 간의 거리가 기하급수적으로 velog.io Dimension Reduction 차원 축소 : 매우 많은 피처로 구성된 다차원 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것 다차원 데이터 세트의 문제점 차원이 증가할 수록 데이터 포인트 간의 거리가 기하급수적으로 멀어지고, 희소한Sparse 구조를 가..

파이썬 머신러닝 완벽 가이드 - 6. Regression(2) (규제, 로지스틱회귀, 회귀 트리 및 예제)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 6. Regression(2) (규제, 로지스틱회귀, 회귀 트리 및 예제) : $w^2$에 대해 패널티를 부여하는 방식. 주요 생성 파라미터는 alpha로, alpha가 커질 수록 회귀 계수 값을 작게 만든다.$RSS(w) + alpha\*||w||\_2^2$ 식을 최소화하는 w를 찾는 것: $|w|$에 패널티를 부여하는 velog.io 5. 규제 Regularization 1. 릿지 회귀 Ridge : $w^2$에 대해 패널티를 부여하는 방식. 주요 생성 파라미터는 alpha로, alpha가 커질 수록 회귀 계수 값을 작게 만든다...

파이썬 머신러닝 완벽 가이드 - 5. Classification(3) (예제 및 스태킹)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 5. Classification(3) (예제 및 스태킹) EDA 중, head, info, describe 사용이상치 발생 ⇒ 제일 많은 걸로 대체하는 방법론도 있음LGBMClassifier( . . . boost_from_average=False) : 레이블값 매우 불균형한 경우 False, if True ⇒ 재현률 및 R velog.io 4. 실전 예시 A. Santander 예시 EDA 중, head, info, describe 사용 이상치 발생 ⇒ 제일 많은 걸로 대체하는 방법론도 있음 B. 신용카드 사기 검출 예시 LGBMC..

파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블) : 여러 개의 분류기(classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법→ 보팅Voting, 배깅Bagging, 부스팅Boosting + 스태킹Stacking보팅 : 서로 다른 알고리즘을 가진 velog.io 3. 앙상블 Ensemble : 여러 개의 분류기(classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법 → 보팅Voting, 배깅Bagging, 부스팅Boosting + 스태킹Stacking 보팅 ..

파이썬 머신러닝 완벽 가이드 - 5. Classification(1) (결정트리)
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 5. Classification(1) (결정트리) Classification 분류 : 학습 데이터로 주어진 데이터의 피처와 레이블 값(결정 값, 클래스 값)을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 이렇게 생성된 모델에 새로운 데이터 값이 주어졌을 velog.io Classification 분류 : 학습 데이터로 주어진 데이터의 피처와 레이블 값(결정 값, 클래스 값)을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 이렇게 생성된 모델에 새로운 데이터 값이 주어졌을 때 미지의 레이블 값을 예측하는 것 나이브 베이즈 Naive ..

파이썬 머신러닝 완벽 가이드 - 2. Pandas
* 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 2. Pandas read_csv() : ,, read_table() : \\t, read_fwf() : 고정길이 파일value_counts(): 해당 칼럼 값의 유형과 건수 확인 (Series 객체에만 정의)describe() : agg류 연산 보여줌2차원 이하의 데이터들만 변환 가 velog.io 🗂 Pandas 판다스 1. 데이터 읽기 및 확인 read_csv() : ,, read_table() : \t, read_fwf() : 고정길이 파일 value_counts(): 해당 칼럼 값의 유형과 건수 확인 (Series 객체에만 ..