Python

    Python파이썬 matplotlib, seaborn을 이용한 데이터 시각화 countplot

    import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb %matplotlib inline 우선, 사용할 라이브러리들을 import 해줍니다. seaborn countplot을 사용해 바차트를 출력 포켓몬 'generation_id'별로 바차트를 그리려고 합니다. data = 데이터 프레임 x = 컬럼명 plt.show() = 메모리상태 글은 빼고 차트만 출력 바 차트의 색상 변경하는 방법 먼저 색상을 변수에 저장해주고 파라미터 color= 에 변수를 넣어줍니다 value_count() 함수를 이용해 세대별 데이터수를 측정후 그걸 변수에 저장해주고 파라미터 order= 에 변수를 입력해줍니다. 데이..

    Python파이썬 Pandas의 dataframe 합치기 concat(),merge()

    1. concat() df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3]) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7']}, index=[4, 5, 6, 7]) df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'], 'B'..

    파이썬Python pandas DataFrame 포함되는 문자 찾기 contains()

    위와 같은 요구사항을 받았을 때 , 그동안은 위 사진처럼 is_tropical()이라는 함수를 만들고 작업을 했었는데, contains()를 사용하면 1줄로 더 쉽게 위 요구사항을 해결할 수 있다. 위 사진과 같이 reviews['description'].str.contains('tropical',case=False).sum()을 입력해주면 위 사진과 같이 13만개 가량의 데이터에서 'tropical'이포함되는 문자를 찾을 수 있다. case=False를 입력해주면 대소문자 구분 없이 찾아주는 것이고 case=True를 입력해주거나, 그냥 공백으로 두면 대소문자 구분을 하고 찾아주는 것이다.

    Python파이썬 Pandas의 sort_values(),sort_index() 정렬하기 / 오름차순 내림차순 asecending=

    import pandas as pd df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) df 우선 위 코드처럼 pandas를 import해주고, df라는 데이터 프레임을 만들어준다. 위 사진처럼 df.sort_values('Years of Experience')를 입력하고 결과를 확인하면 Years of Experience 컬럼이 1 , 3 , 4 , 9 즉 오름차순으로 정렬해 준다. ascending=False를 ,뒤에 입력해주면 내림차순..