인공지능/딥러닝

딥러닝 : Time Series 데이터를 처리할 때 사용하는 resample()

왕현성 2023. 1. 3. 15:36
728x90

resample()함수

# 그룹바이함수를 이용해서는 날짜 데이터로 바로
# 년 단위, 월 단위, 일 단위, 시 단위, 분 단위, 초 단위 등으로 묶어라
# 라고 할 수가 없다
# 따라서 먼저 Date컬럼을 인덱스로 만들어준다.
# 그러면 resample 함수를 사용할 수 있게 된다.
# 바로 이 함수가, 년단위 월단위 등등으로 데이터를 묶어서 처리가 가능하다.
 
 
 
이 함수를 사용하기위해 인덱스를 설정하는 방법
 
chicago_df.index = chicago_df['Date'] # 데이터 프레임의 인덱스를 데이터프레임의 'Date'컬럼으로하라

인덱스가 바뀐 것을 확인

 

참고 자료

# resample  'Y' 는 년도다. 년도로 리샘플한 후, 각 년도별 몇개의 범죄 데이터를 가지고 있는지 확인한다.

 

df_year=chicago_df.resample('Y').size()
# 위의 데이터를 plot 으로 시각화 한다. 범죄횟수를 눈으로 확인
plt.plot(df_year)
plt.show()

# 월별 범죄 발생 건수를 확인하자.
df_month=chicago_df.resample('M').size()
df_month.plot()
plt.show()

# 분기별 범죄 건수도 확인하자.
df_q=chicago_df.resample('Q').size()
df_q.plot()
plt.show()