디버깅 ( 오류 해결 과정 )

파이썬 pandas,데이터 시각화 실습 문제풀이 오류 해결

왕현성 2022. 11. 29. 10:30
728x90

위 데이터프레임은 연령별 인구현황 통계표(남녀구문을 uncheck, 연령1세단위, 0~100, 전체읍면동현황)입니다.이를

df로 저장하고난 후 문제풀이를 하겠습니다.

실습 1. '삼청동' 의 인구 구조를, 0세부터 100세 까지 나이대 별로 몇명이 있는지 시각화 하세요.

 

 df['행정구역'].str.contains('삼청동') ## 삼청동이 있는 인덱스를 찾은 후에

df2=df.loc[df['행정구역'].str.contains('삼청동'),'2019년07월_계_0세':].values ## 요구사항에 맞게 밸류값들만 추출

df2=df2.reshape(101,) ## df2를 확인해보니 2차원 데이터이기때문에 갯수확인 후 1차원 데이터로 바꿔준다.

x=np.arange(0,100+1) ## 0세부터 100세까지니 차트의 x값 0~100의 숫자를 변수 x에 저장

 

위와같이 타이핑을 했더니

에러가 발생한다. 한참을 고민 후에

dtype=object

1000단위마다 ','가 붙어있기 때문에  타입이 문자열로 되어있는 것을 알게 되었고 이를 정수 또는 실수로 바꿔주기 위해

thousands=','   ## 1000단위마다 ,가 있으니 이를 숫자로 처리 해달라는 파라미터를 사용했다.

 

이후

plt.plot(x,df2)를 입력하여 요구사항에 맞게 데이터를 시각화 할 수 있었다.