인공지능/머신러닝

머신 러닝 : Training / Test set , 트레이닝 용 / 테스트 용 데이터 나누기 train_test_split()

왕현성 2022. 12. 1. 11:45
728x90
from sklearn.model_selection import train_test_split

transform 한  X , y 를 가져온다.

from sklearn.model_selection import train_test_split

import를 불러온 뒤 

train_test_split()을 이용하여 데이터를 트레이닝용 테스트용으로 나눠준다.

 

X_train, X_test , y_train , y_test = train_test_split(X, y, test_size=0.2,random_state=3)

 

test_size =       => X_test, y_test 를 얼마나 저장할지 단위를 나타내주며

random_state=            => random 무작위로 뽑아오는 숫자를 뜻한다

 같은 식으로 같은 숫자를 대입하면 값은 값이 나올 수 있다.