인공지능

    딥러닝 : GridSearch를 이용한 최적의 하이퍼 파라미터 찾기

    # Tuning the ANN from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selection import GridSearchCV from keras.models import Sequential from keras.layers import Dense 우선 필요한 라이브러리들을 임포트 해줍니다. # tensorflow로 그리드서치 하기 위해서 # 1. 모델링하는 함수를 만든다. from keras.layers.attention.multi_head_attention import activation def build_model(optimizer): # 모델링 model = Sequential() model.add(Dense..

    딥러닝 : Dummy variable trap

    # France , Germany , Spain 3개 컬럼으로 만들었는데, # 실제로는 원핫 인코딩을 수행한 후에, 맨 왼 쪽 컬럼은 삭제해도 # 0과 1로 데이터를 전부 나타낼 수 있다. # 즉, France 컬럼을 삭제해도 # Germany,Spain # 0 0 => France # 1 0 => Germany # 0 1 => Spain # 이렇게 맨 왼 쪽 france컬럼을 삭제해도 3개의 데이터를 모두 나타낼 수 있다. X_df=pd.DataFrame(X) X_df.drop(0,axis=1,inplace=True) X = X_df.values 이렇게 사용하는 이유는 메모리를 효율적으로 사용하기 위함입니다.

    딥러닝 : tensorflow로 분류의 문제 모델링 하는 방법

    우선 사용할 라이브러리들 import후 데이터 프레임을 불러옵니다. import numpy as np import matplotlib.pyplot as plt import pandas as pd import seaborn as sns import os %matplotlib inline df = pd.read_csv('Churn_Modelling.csv') 1. 결측치 확인 df.isna().sum() 위 데이터 프레임에는 결측치가 없었기 때문에 nan 처리를 안 하였습니다. 2. X와 y로 분리 X=df.iloc[:,3:-1] y=df['Exited'] 3. 문자열 데이터 처리 ( LabelEncoder , OneHotEncoder) X['Geography'].nunique() X['Gender'].nu..

    딥러닝 : fit 함수에서 배치 사이즈 (batch_size= )와 에포크(epochs=)

    우선 필요한 라이브러리들을 import 해줍니다. import tensorflow as tf from tensorflow import keras from keras.models import Sequential from keras.layers import Dense model.fit(X_train,y_train,batch_size=10,epochs=20) 컴파일이 끝난 후에 학습을 할 때 위와 같은 코드로 학습을 실시 한다. epoch 한 번의 epoch는 신경망에서 전체 데이터 셋에 대해 forward pass/backward pass 과정을 거친 것을 말함. 즉, 전체 데이터 셋에 대해 한 번 학습을 완료한 상태 전체 데이터를 몇 번 반복할 것인가에 대한 수를 epochs= 뒤에 적어준다. batch_..