Python

    Python파이썬 pandas DataFrame NaN 삭제, NaN변경,NaN삭제전략

    df라는 변수에 DataFrame을 저장해준다. df는 위 사진과 같다. 1. 삭제하는 전략 df.dropna()을 입력해주면 NaN을 삭제한다 즉 NaN이라는 데이터가 들어있는 행을 삭제하는 방법이다 위 사진과 같이 store1,store3가 사라진 store2만 보여지게 된다. 2. 특정 값으로 채우는 전략 df.fillna()을 입력해주면 NaN을 fillna의 파라미터에 있는 값으로 데이터를 채워주는 방법이다. 아래 사진과 같이 df.fillna(0)을 입력해주면 NaN을 0으로, df.fillna('데이터없음')을 입력해주면 '데이터없음'으로 채워준다. 비어있는 데이터의 위,아래 행 / 왼쪽,오른쪽 열의 데이터로 채우는 방법은 아래 사진과 같다. df.fillna(method='ffill', a..

    Python파이썬 pandas DataFrame NaN 파악, NaN개수

    비어있는 데이터가 어디에 몇개나 있는지 먼저 파악하는 방법은 df.isna() 를 입력해주게 되면 위 사진과 같이 데이터 값이 비어있지 않으면 False 비어있으면 True라고 보여준다. 갯수를 확인하는 방법은 df.isna().sum().sum()을 해주게 되면 True 즉 1의 갯수를 모두 더해주어 위 사진처럼 3이라고 보여진다.

    Python파이썬 pandas의 DataFrame 정보보기info(),통계치 보기describe() , 위/아래 잘라서 보기 head() / tail()

    Pandas를 사용하기 앞서 Pandas를 import 해야 합니다. Pandas 코드를 편하게 사용하기 위해 as pd를 붙임으로써 pd로 사용한다. 먼저 read_csv로 첨부파일을 읽어오고 그 데이터프레임을 reviews에 저장한다. reviews.info()를 사용하여 데이터 프레임의 정보를 확인하고 reviews.describe()를 사용하여 데이터 프레임의 통계치를 확인할 수 있다. # 데이터 프레임의 맨 윗 부분 5개 데이터를 보여준다. reviews.head() # 데이터 프레임의 맨 끝 데이터5개를 확인하는 방법 reviews.tail() # 데이터 프레임의 맨 윗 부분 2개 데이터 확인하는 방법 reviews.head(2) # 데이터 프레임의 맨 끝 데이터 6개 데이터 확인하는 방법 r..