본문 바로가기
Python/Pandas, Matplotlib, Seaborn

[Pandas]_Pandas library basic (1) I/O, 행과 열 추출

by ssolLEE 2023. 8. 9.
반응형

파일 입출력 하기

  • 현재 경로 확인하기
import os  
os.getcwd() # 파일 현재 경로
  • 파일 만들고 저장하기
import pandas as pd

sample_df = pd.DataFrame({"col1" : [1, 2], "col2" : [3, 4]})
sample_df

sample_df.to_csv("output/sample/test1.csv", index=False)
    •  위의 마지막 줄에서 저장하고 싶은 경로로 선택하여 파일을 저장할 수 있습니다. 
    • 설정안하면 현재 경로에 파일이 생성됩니다.
sample_df.to_csv("저장 경로/test1.csv", index=False)
  • 파일 불러오기
data = pd.read_csv('./output/sample/test1.csv')
print(data)
  • 이어서 실습할 데이터를 블러오겠습니다.
df_boston = pd.read_csv("./data/boston.csv")
df_boston.head(1)

 

열 및 행 선택하기

  • CRIM, ZN, INDUS 열만 선택하기
cols = ['CRIM', 'ZN', 'INDUS']
result = df_boston[cols]
result.head(1)

  • ZN이 18.0에 해당하는 행만 추출
result = df_boston[df_boston['ZN'] == 18.0]
result
  • 행 추출의 기본 원리는 조건문입니다. 
  • 조건문은 다음과 같으며, True나 False로 출력됩니다. 기본적으로는 True값만 가져온다고 보면 됩니다.
  • df_boston['ZN'] == 18.0   # 다양한 비교 연산이 포함됩니다.

  • AGE가 50 이상인 데이터만 추출
result = df_boston[df_boston['AGE'] >= 50 ].reset_index(drop=True)
result   # 이건 인덱스 번호 다시 정렬하는 것

  • INDUS가 5.0 이상이면서 B가 394이상인 데이터 추출
  • 조건식이 여러 개일 때는 이렇게 연산기호를 사용합니다. result = df_boston[(조건식1) & (조건식2)]
result = df_boston[(df_boston['INDUS'] >= 5.0) & (df_boston['B'] >=394)].reset_index(drop=True)
result.head(1)