728x90
resample()함수
# 그룹바이함수를 이용해서는 날짜 데이터로 바로
# 년 단위, 월 단위, 일 단위, 시 단위, 분 단위, 초 단위 등으로 묶어라
# 라고 할 수가 없다
# 따라서 먼저 Date컬럼을 인덱스로 만들어준다.
# 그러면 resample 함수를 사용할 수 있게 된다.
# 바로 이 함수가, 년단위 월단위 등등으로 데이터를 묶어서 처리가 가능하다.
이 함수를 사용하기위해 인덱스를 설정하는 방법
chicago_df.index = chicago_df['Date'] # 데이터 프레임의 인덱스를 데이터프레임의 'Date'컬럼으로하라
인덱스가 바뀐 것을 확인
참고 자료
# resample 'Y' 는 년도다. 년도로 리샘플한 후, 각 년도별 몇개의 범죄 데이터를 가지고 있는지 확인한다.
df_year=chicago_df.resample('Y').size()
# 위의 데이터를 plot 으로 시각화 한다. 범죄횟수를 눈으로 확인
plt.plot(df_year)
plt.show()
# 월별 범죄 발생 건수를 확인하자.
df_month=chicago_df.resample('M').size()
df_month.plot()
plt.show()
# 분기별 범죄 건수도 확인하자.
df_q=chicago_df.resample('Q').size()
df_q.plot()
plt.show()
'인공지능 > 딥러닝' 카테고리의 다른 글
DarkLabel 사용법 (0) | 2023.05.31 |
---|---|
Yolov8 - 내 커스텀 데이터를 이용해 학습하기 / 훈련 데이터와 검증 데이터로 나누기 (0) | 2023.05.31 |
딥러닝 : Prophet 라이브러리를 이용한 Time Series 데이터 예측 (0) | 2023.01.02 |
딥러닝 : 에포크 시마다 가장 좋은 모델을 저장하는 ModelCheckpoint와 기록을 남기는 CSVLogger 사용법 (0) | 2023.01.02 |
딥러닝 : Fine tuning 파인튜닝 (0) | 2023.01.02 |