Python

    Python파이썬 pandas 데이터프레임으로 만들기 to_frame()

    위 사진의 요구사항은 다음과 같다 데이터의 각 host_name의 갯수를 구하고 갯수 기준 내림차순 정렬한 데이터 프레임을 만들어라. value_counts()를 이용하여 각 갯수를 구하였고 내림차순 정렬까지 하였다.이후 요구사항인 데이터프레임으로 만드는 방법은 df['host_name'].value_counts().to_frame() 다음과 같이 뒤에 to_frame()함수를 이용해주면 아래사진같이 된다.

    파이썬Python pandas DataFrame 포함되지않는 문자 찾기 '~', contains()

    DataFrame은 다음과 같다 요구사항 : df의 데이터 중 choice_description 값에 Vegetables 들어가지 않는 경우의 갯수를 출력하라 df['choice_description'].str.contains('Vegetables',case=False) ## 먼저 포함되는 것을 찾는다. (df['choice_description'].str.contains('Vegetables',case=False) == False).sum() ## ~을 알기 전에 내가 사용했던 코드, ~df['choice_description'].str.contains('Vegetables',case=False) ## 이것보다 간단한 방법이 있는 것을 알게된 후 ~을 사용한 코드 ~을 사용하니 True와 False가 ..

    Python파이썬 데이터 시각화 matplotlib heatmaps hist2d()

    # displ과 comb의 관계를 나타내되, # 데이터가 많고 적음을 표시할 수 있도록, # heat map으로 시각화 plt.hist2d(data=df,x='displ',y='comb',cmin=0.5,cmap='viridis_r',bins=20) plt.colorbar() # 색깔 의미를 알려줌 plt.title('배기량과 연비 관계') plt.xlabel('displacement (L)') plt.ylabel('연비 (mpg)') plt.savefig('차트1.png') plt.show()

    Python파이썬 데이터 시각화 matplotlib seaborn regplot , pairplot

    sb.regplot(data=df,x='displ',y='comb') plt.title('Displ Vs Comb') plt.xlabel('Displacement (L)') plt.ylabel('Combined Fuel Eff (mpg)') plt.show() # reg의 뜻?? regression : 데이터에 fitting한다는 의미. sb.pairplot(data=df,vars=['displ','comb','co2']) plt.show()