인공지능/머신러닝

    머신러닝 : Feature Scaling , 피쳐 스케일링,StandardScaler,MinMaxScaler, 표준화,정규화

    # 유클리디언 디스턴스로 오차를 줄여 나가는데, 하나의 변수는 오차가 크고, # 하나의 변수는 오차가 작으면, 나중에 오차를 수정할때 편중되게 된다. # 따라서 값의 레인지를 맞춰줘야 정확히 트레이닝 된다. StandardScaler() rom sklearn.preprocessing import StandardScaler,MinMaxScaler 를 import 해준 뒤 StandardScaler() 가 들어 있는 변수를 만들어 준다 . (대부분 'scaler' 로 표시한다.) scaler.transform()을 불러 준뒤 train test 중 필요한 값들을 넣어준다. MinMaxScaler() from sklearn.preprocessing import StandardScaler,MinMaxScaler..

    머신러닝 : 원 핫 인코딩 One Hot Encoding

    # 레이블 인코딩으로 변환한 후에, 학습을 시켰을 때 ,,,, # 카테고리컬의 데이터의 갯수가 3개 이상일 때는, # 레이블 인코딩으로 학습하면 학습이 잘 안된다. # 이렇게 3개 이상의 카테고리컬 데이터는 One-Hot Encoding을 # 이용해서 처리하면, 학습이 잘 된다. from sklearn.preprocessing import LabelEncoder, OneHotEncoder from sklearn.compose import ColumnTransformer ct=ColumnTransformer([('encoder', OneHotEncoder(),[2])],remainder='passthrough') ct.fit_transform(X) 맨 아래 사진과 같이 결과를 얻을 수 있다. 원핫인코딩이 ..

    머신러닝 : 레이블 인코딩 Label Encoding

    Label Encoding Label Encoding 이란 알파벳 오더순으로 숫자를 할당해주는 것을 말한다. 하지만 적용이 쉽지만은 않은 Label Encoding. 위 시나리오에서 Country라는 데이터는 순서나 랭크가 없다. 그러나 Label Encoding을 수행하면 결국엔 알파벳 순으로 랭크가 되는 것이고, 그로 인해서 랭크된 숫자정보가 모델에 잘못 반영될 수가 있겠다.

    MachineLearning머신러닝 기본 설명 , 인공지능&머신러닝&딥러닝

    머신러닝으로 할 수 있는 것 편지봉투에 손으로 쓴 우편번호 숫자 자동 판별 의료 영상 이미지에 기반한, 종양 판단 의심되는 신용카드 거래 감지 블로그 글의 주제 분류 고객들을 취향이 비슷한 그룹으로 묶기 # supervised 인공지능한테 정답을 알려주며 학습시키는 것. # unsupervised 인공지능이 정답을 모르는 상태로 학습 시키는 것 (고객 분석에 많이 사용 ) # classification =분류 (분류가 가능한거) # prediction = 예측 (수치가 나오는 값) # regression (수치가 나오는 값) # clustering (군집화 (큰 데이터에서 원하는 데이터끼리 묶어서 사용하는 것))