머신러닝

    파이썬 머신러닝 완벽 가이드 - 8. Clustering(1) (K-Mean, Cluster Evaluation)

    파이썬 머신러닝 완벽 가이드 - 8. Clustering(1) (K-Mean, Cluster Evaluation)

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 8. Clustering(1) (K-Mean, Cluster Evaluation) 분류와 유사해보일 수 있지만 성격이 다르다. 데이터 내에 숨어있는 별도의 그룹을 찾아서 의미를 부여하거나, 동일한 분류값에 속하더라도 그 안에서 더 세분화된 군집화를 추구하거나, 서로 velog.io Clustering 군집화 분류와 유사해보일 수 있지만 성격이 다르다. 데이터 내에 숨어있는 별도의 그룹을 찾아서 의미를 부여하거나, 동일한 분류값에 속하더라도 그 안에서 더 세분화된 군집화를 추구하거나, 서로 다른 분류값의 데이터도 더 넓은 군집화 레벨화..

    파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(2) (SVD, NMF)

    파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(2) (SVD, NMF)

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(2) (SVD, NMF) : PCA와 유사. 정방 행렬뿐만 아니라 행과 열의 크기가 다른 행렬에도 적용 가능Full SVD$A = U \\sum V^T$$A$ : 행렬, $U$, $V$: 특이벡터(Singular vector)로 된 행렬, $\\sum$ : 대각행렬$\\sum$ : 대각행렬 velog.io 3. SVD(Singular Value Decomposition, 특이 값 분해) : PCA와 유사. 정방 행렬뿐만 아니라 행과 열의 크기가 다른 행렬에도 적용 가능 Full SVD $A =..

    파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(1) (PCA, LDA)

    파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(1) (PCA, LDA)

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 7. Dimension Reduction(1) (PCA, LDA) : 매우 많은 피처로 구성된 다차원 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것다차원 데이터 세트의 문제점차원이 증가할 수록 데이터 포인트 간의 거리가 기하급수적으로 velog.io Dimension Reduction 차원 축소 : 매우 많은 피처로 구성된 다차원 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것 다차원 데이터 세트의 문제점 차원이 증가할 수록 데이터 포인트 간의 거리가 기하급수적으로 멀어지고, 희소한Sparse 구조를 가..

    파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블)

    파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블)

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블) : 여러 개의 분류기(classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법→ 보팅Voting, 배깅Bagging, 부스팅Boosting + 스태킹Stacking보팅 : 서로 다른 알고리즘을 가진 velog.io 3. 앙상블 Ensemble : 여러 개의 분류기(classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법 → 보팅Voting, 배깅Bagging, 부스팅Boosting + 스태킹Stacking 보팅 ..

    파이썬 머신러닝 완벽 가이드 - 4. Evaluation

    파이썬 머신러닝 완벽 가이드 - 4. Evaluation

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 4. Evaluation 실제 데이터에서 예측 데이터가 얼마나 같은지 판단하는 지표$$⁍ $$특히 정확도는 불균형한 레이블 값 분포에서는, 적합한 평가 지표가 아님ex) MNIST 데이터 셋을 다중분류에서 이진분류로 바꾸 velog.io Evaluation 평가 ( in 분류) 1. 평가 지표 1. 정확도 Accuracy 실제 데이터에서 예측 데이터가 얼마나 같은지 판단하는 지표 특히 정확도는 불균형한 레이블 값 분포에서는, 적합한 평가 지표가 아님 ex) MNIST 데이터 셋을 다중분류에서 이진분류로 바꾸면 (7을 True, 나머지..

    파이썬 머신러닝 완벽 가이드 - 3. Scikit-Learn

    파이썬 머신러닝 완벽 가이드 - 3. Scikit-Learn

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 3. Scikit-Learn Classifier 분류: DecisionTreeClassifier, RandomForestClassifier, GradientBoostingClassifier, GaussianNB, SVCRegressor 회귀: LinearRegression, Ridge, Lasso velog.io Scikit-Learn 사이킷런 1. Estimator 1. Classifier 분류 : DecisionTreeClassifier, RandomForestClassifier, GradientBoostingClassifier,..

    파이썬 머신러닝 완벽 가이드 - 2. Pandas

    파이썬 머신러닝 완벽 가이드 - 2. Pandas

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 2. Pandas read_csv() : ,, read_table() : \\t, read_fwf() : 고정길이 파일value_counts(): 해당 칼럼 값의 유형과 건수 확인 (Series 객체에만 정의)describe() : agg류 연산 보여줌2차원 이하의 데이터들만 변환 가 velog.io 🗂 Pandas 판다스 1. 데이터 읽기 및 확인 read_csv() : ,, read_table() : \t, read_fwf() : 고정길이 파일 value_counts(): 해당 칼럼 값의 유형과 건수 확인 (Series 객체에만 ..

    파이썬 머신러닝 완벽 가이드 - 1. Numpy

    파이썬 머신러닝 완벽 가이드 - 1. Numpy

    * 티스토리에서 마크다운 적용이 안돼서 깨지는 부분이 많습니다. * 깨지지 않은 파일로 자세히 보기 원하시는 분들은 아래 링크 참고해주세요! 파이썬 머신러닝 완벽 가이드 - 1. Numpy 데이터 타입: ndarrayarray(): 인자를 받아 ndarray로 변환arange(): 연속된 숫자(정수)를 ndarray로 변환 예) np.arange(10): 0~9의 숫자를 ndarray로 만듦 zeros(): shape 값을 입력하면 0으로 채운 뒤 해 velog.io Numpy 넘파이 1. 데이터 생성 및 수정 데이터 타입: ndarray array(): 인자를 받아 ndarray로 변환 arange(): 연속된 숫자(정수)를 ndarray로 변환 예) np.arange(10): 0~9의 숫자를 ndar..

    "ㅇㅇ후보가 당선할 것" AI의 예측 맞았을까

    "ㅇㅇ후보가 당선할 것" AI의 예측 맞았을까

    📰 본문 “여론조사는 틀렸고, 인공지능(AI)이 맞았다.” 2016년 미국 대통령 선거 직후 나왔던 얘기입니다. 당시 뉴욕타임스, 폭스뉴스, 워싱턴포스트, CBS 등 미국 주요 언론사들의 여론조사는 힐러리 클린턴의 승리를 예상했습니다. 반면 인도의 모그IA, 캐나다 어드밴스드 심볼릭스의 AI폴리 등 여러 AI 프로그램은 도널드 트럼프가 당선할 것이라고 점쳤고요. 실제 결과는 트럼프의 승리였습니다. 이는 세계의 이목이 집중된 미국 대선에서 AI가 기성 여론조사를 확실히 제친 첫 사례로 꼽힙니다. 이후 영미권에선 선거 결과 예측 등에 AI를 활용하는 사례가 꾸준합니다. 국내에서도 대선에서 AI의 영역이 늘고 있는 분위기입니다. 2020 美 대선 결과도 맞힌 AI 투표 결과를 예측하는 AI는 점점 많아지고 있..