Python

    Python파이썬 pandas APPLYING FUNCTIONS//Apply()

    위 사진의 요구사항처럼 컬럼을 가져와서 apply()를 이용해서 처리를 해보았다. apply()를 사용하는 방법이 아닌 , 위 사진 처럼 str.upper() 문자열의 upper()함수를 이용해서 처리했다. 위 사진의 요구사항은 시급이 30이상이면 , A라고하고 그렇지 않으면 B라고구분해서 새로운 컬럼인 'group'을 만들어 저장하는 작업까지 해달라고했다. def grouping(salary): if salary >= 30: return 'A' else: return 'B' 우선 이렇게 grouping()이라는 함수를 만들어 준 후 .apply()를 이용해 A 또는 B로 새로운 컬럼 그룹을 만들어보았다.

    Python파이썬 groupby(),agg(),values_counts()

    파이썬 pandas에서 ~별로라는 표현을 보면 groupby()가 떠올라야 한다. df.groupby('Year')['Salary'].sum()을 입력해주게 되면 각 Year별로 지급한 연봉의 총합 => ['Salary'].sum()을 구해준다. 위 사진의 요구사항처럼 총합,평균,표준편차를 한 줄에 보여주게 하려면 우선 import numpy as np를 입력해주어 numpy라이브러리를 import 해주고 df.groupby('Year')['Salary'].agg( [np.sum,np.mean,np.std] )를 입력해주어 위 사진의 결과처럼 나오게할 수 있다. 그 아래 요구사항은 df.groupby('Name')['Name'].count() 또는 df['Name'].value_counts()를 입력해주..

    Python파이썬 DataFrame 카테고리컬 데이터(categorical Data),unique(),nunique()

    위 사진과 같이 csv파일을 가져온 후 df['Year'].unique()을 이용해 중복을 확인할 수 있고 df['Year].nunique()을 이용해 유니크한 데이터의 갯수를 확인할 수 있다.