왕현성
코딩발자취
왕현성
전체 방문자
오늘
어제
  • 코딩 (277)
    • Python (71)
    • Java (16)
    • MySQL (34)
    • 인공지능 (48)
      • 머신러닝 (16)
      • 딥러닝 (32)
    • 영상처리 (4)
    • Rest API (21)
    • Android Studio (25)
    • streamlit (13)
    • DevOps (22)
      • AWS (9)
      • PuTTY (5)
      • Git (4)
      • Serverless (2)
      • Docker (2)
    • IT 기술 용어 (6)
    • 디버깅 ( 오류 해결 과정 ) (17)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • alibi-detection
  • PYTHON
  • tune()
  • ckpt_file
  • 영상처리역사
  • numpy
  • OpenCV
  • alibidetect
  • get_long_description
  • yolov8
  • 딥러닝
  • labelme
  • 영상처리
  • labelme UnocodeDecodeError
  • 기상탐사
  • 비지도학습
  • pytorch
  • imageprocessing
  • TensorFlow
  • encoding='utf-8'
  • pip install labelme
  • unsupervised
  • 컴퓨터비전
  • 영상기술
  • UnboundLocalError
  • maskimage
  • PIL
  • matplotlib
  • 의료이미징
  • ComputerVision

최근 댓글

최근 글

티스토리

250x250
hELLO · Designed By 정상우.
왕현성

코딩발자취

머신 러닝 :  Logistic Regression up sampling기법 imblearn.over_sampling SMOTE
인공지능/머신러닝

머신 러닝 : Logistic Regression up sampling기법 imblearn.over_sampling SMOTE

2022. 12. 2. 12:03
728x90

위와 같은 사진의 데이터프레임에서 당뇨병을 분류하는 모델을 만드는 도중 

y값을 'class'컬럼으로 두었다. 당뇨병 환자는 1, 아닐 경우 0이다.

 

sb.countplot(data=df,x='class')
plt.show()

위 코드를 작성하여 시각화 해보니

당뇨병인 사람의 데이터가 훨씬 적다.

그래서 up sampling 기법으로, 당뇨병 데이터를 늘려보았다.

from imblearn.over_sampling import SMOTE
sm = SMOTE(random_state=2)
X,y=sm.fit_resample(X,y)
X

'class'의 밸류 값들이 1도 500 / 0도 500으로된 것을 확인할 수 있다.

 

이후

 

피처스케일링부터 검증까지 해주고 이를 seaborn의 heatmap으로 시각화까지 해보았다

sb.heatmap(data=cm,annot=True,cmap='RdPu',linewidths=0.7)
plt.show()

'인공지능 > 머신러닝' 카테고리의 다른 글

머신러닝 : Support Vector Machine SVM  (0) 2022.12.02
머신 러닝 : KNN알고리즘 (K-Nearest Neighbor)  (0) 2022.12.02
머신 러닝 : Logistic Regression , Confusion Matrix  (0) 2022.12.02
머신러닝 : Multiple Linear Regression  (0) 2022.12.01
머신러닝 : Linear Regression  (0) 2022.12.01
    '인공지능/머신러닝' 카테고리의 다른 글
    • 머신러닝 : Support Vector Machine SVM
    • 머신 러닝 : KNN알고리즘 (K-Nearest Neighbor)
    • 머신 러닝 : Logistic Regression , Confusion Matrix
    • 머신러닝 : Multiple Linear Regression
    왕현성
    왕현성
    AI 머신비전 학습일지

    티스토리툴바