Python

    Python 파이썬 pandas DataFrame 데이터 가공하기

    ' = ' 기호를 사용하여 데이터 값을 변경하고 추가하는 작업을한 코드이다.

    Python파이썬 pandas DataFrame 데이터 억세스(3)

    데이터억세스하는 세번째 방법은 컴퓨터가 자동으로 매기는 행과 열의 인덱스를 통해 가져올 수 있다. .iloc()인 함수를 통해 0부터 시작하는 index,columms 의 값을 대입하여 가져올 수 있다. df df.iloc[0,1] # df의 인데스 0 컬럼 1의 데이터를 가져와라. df.iloc[ 1 , 0:2+1 ] # 인덱스 1 컬럼 0~2+1까지의 데이터를 가져와라. df.iloc[ 0 , [0,2,3] ] # 인덱스 0 컬럼 0,2,3의 데이터를 가져와라. 이렇게 코드 작성을 해주면 위에있는 사진과 같이 결과를 얻을 수 있다. .iloc를 사용할 경우 컴퓨터가 매기는 인덱스이기 때문에 문자열을 절대! 사용하면 안되며 정해진 정수 인덱스를 입력하여야 한다/.

    Python파이썬 pandas DataFrame 데이터 억세스(2)

    DataFrame 데이터 억세스 방법 중 2번째 행과 열의 정보로, 데이터를 가져오는 방법중에서 .loc[ , ]로 가져오는 방법이 있다. 이 방법은, 사람용인 인덱스와 컬럼명으로 데이터를 억세스한다. 위 사진의 요구사항을 받으면, df.loc['store1','pants'] # 스토어1의 팬츠 데이터를 가져와라. df.loc['store2',['bikes','watches']] # 스토어 2에서, bikes와 watches데이터를 가져와라. df.loc['store2' ,'pants':'glasses' ] # # 스토어2에서, pants부터 glasses까지의 데이터를 가져와라 로 코드를 작성을 해주면 위 사진과같은 결과를 얻을 수 있다.

    Python파이썬 pandas DataFrame 데이터 억세스(1)

    데이터 프레임에서 원하는 데이터를 억세스하는 방법중 1번째는 컬럼의 데이터를 가져오는 방법 즉 변수명 바로 오른 쪽에 대괄호를 사용하여 억세스해주는 방법이다. items2 = [{'bikes': 20, 'pants': 30, 'watches': 35}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5}] # 변수를 지정 df=pd.DataFrame(data=items2,index=['store1','store2']) # 변수를 가지고 판다스의 데이터프레임 생성 df['bikes'] df['watches'] df[['bikes','glasses']] 코드를 작성해주면 위 사진과 같은 결과를 얻을 수 있다.