728x90
위 데이터프레임은 연령별 인구현황 통계표(남녀구문을 uncheck, 연령1세단위, 0~100, 전체읍면동현황)입니다.이를
df로 저장하고난 후 문제풀이를 하겠습니다.
실습 1. '삼청동' 의 인구 구조를, 0세부터 100세 까지 나이대 별로 몇명이 있는지 시각화 하세요.
df['행정구역'].str.contains('삼청동') ## 삼청동이 있는 인덱스를 찾은 후에
df2=df.loc[df['행정구역'].str.contains('삼청동'),'2019년07월_계_0세':].values ## 요구사항에 맞게 밸류값들만 추출
df2=df2.reshape(101,) ## df2를 확인해보니 2차원 데이터이기때문에 갯수확인 후 1차원 데이터로 바꿔준다.
x=np.arange(0,100+1) ## 0세부터 100세까지니 차트의 x값 0~100의 숫자를 변수 x에 저장
위와같이 타이핑을 했더니
에러가 발생한다. 한참을 고민 후에
dtype=object
1000단위마다 ','가 붙어있기 때문에 타입이 문자열로 되어있는 것을 알게 되었고 이를 정수 또는 실수로 바꿔주기 위해
thousands=',' ## 1000단위마다 ,가 있으니 이를 숫자로 처리 해달라는 파라미터를 사용했다.
이후
plt.plot(x,df2)를 입력하여 요구사항에 맞게 데이터를 시각화 할 수 있었다.
'디버깅 ( 오류 해결 과정 )' 카테고리의 다른 글
MySQL - workbench 에서 업데이트할때 safe update mode Code:1175 해결방법 (1) | 2022.12.06 |
---|---|
머신 러닝 : 데이터가 없어서 다른 값(0)으로 셋팅하는 경우 다른 값으로 셋팅된 값을 NaN으로 바꿔주는 방법 판다스의 replace() (0) | 2022.12.02 |
Python파이썬 pandas 문자열 함수 사용 에러 (0) | 2022.11.25 |
Python파이썬 pandas DataFrame 데이터 억세스 실습문제 해결 (0) | 2022.11.24 |
Python파이썬 numpy boolean연산 오류 해결 (0) | 2022.11.23 |