인공지능/머신러닝
지도학습 vs 비지도학습 쉽게 이해하기
지도학습과 비지도학습은 머신러닝의 핵심 개념입니다. 이 두 가지 방법에 대해 이해하면, 인공지능이 어떻게 학습하고 어떻게 작동하는지 이해하는 데 큰 도움이 됩니다. 이 포스트에서는 이 두 가지 방법에 대해 간단하고 이해하기 쉽게 설명하겠습니다. 1. 지도학습 (Supervised Learning) 지도학습은 머신러닝의 가장 일반적인 형태입니다. 이 방법에서는, 모델은 '레이블'이라는 정답이 붙어있는 데이터를 학습합니다. 레이블이라는 것은 각 데이터에 대한 정답 또는 결과를 말합니다. 예를 들어, 고양이와 강아지의 사진을 구분하는 모델을 학습시키는 경우, 각 사진에 '고양이' 또는 '강아지'라는 레이블이 붙어있습니다. 지도학습은 마치 학생이 선생님의 지도를 받아 공부하는 것과 비슷합니다. 모델은 레이블을 ..
머신러닝 : Hierarchical Clustering과 Dendrogram
import numpy as np import matplotlib.pyplot as plt import pandas as pd 우선 사용할 라이브러리들을 임포트 해줍니다. df=pd.read_csv('../data/Mall_Customers.csv') df 데이터프레임을 읽어온 후 변수 df로 저장 df.isna().sum() 결측치 확인 X = df.iloc[:,3:] X 데이터 셋팅 Dendrogram 을 그리고, 최적의 클러스터 갯수를 찾아보자. import scipy.cluster.hierarchy as sch sch.dendrogram(sch.linkage(X,method='ward')) plt.title('Dendrogram') plt.xlabel('Custromers') plt.ylabel(..
머신러닝 : K-Means Clustering
K-Means Clustering은 Unsupervised Learning이다. 다음을 두개, 세개, 네개 그룹 등등 원하는 그룹으로 만들 수 있다. 또다시 중심에 직교하는 선을 긋고, 자신의 영역안에 있는 것들을 자신의 색으로 바꾼다. import numpy as np import pandas as pd import matplotlib.pyplot as plt 우선 필요한 라이브러리들을 import 해줍니다. df=pd.read_csv('../data/Mall_Customers.csv') df 데이터 프레임 확인, describe로 데이터 요약통계랑을 확인하고 df.isna().sum() 결측치 확인 X,y를 분리하여 셋팅하던 이전 포스팅 글들과는 다르게 언수퍼바이즈드 러닝은 y가 없기 때문에, X만 ..
머신러닝 : Decision Tree
계속하여 이것인지 저것인지 결정한다. Decision Tree # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd csv 파일을 읽어옵니다. X=df.iloc[:,[2,3]] y=df['Purchased'] ## X,y 분리 from sklearn.preprocessing import MinMaxScaler scaler_X = MinMaxScaler() X=scaler_X.fit_transform(X) ## 피처 스케일링 과정 from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test=train_..