저장된 파일을 데이터프레임으로 읽어올 때 na_values, na_filter 매개변수 활용하기

2024. 1. 21. 11:09·파이썬/Pandas
반응형

Pandas에서는 read_csv(), read_excel(), read_json() 등의 함수를 사용하여 저장된 파일을 데이터프레임으로 읽어올 수 있습니다. 이러한 함수에는 na_values와 na_filter 매개변수를 사용하여 결측값을 처리할 수 있습니다.

 

na_values

na_values 매개변수는 결측값으로 처리할 값을 지정합니다. na_values 매개변수를 지정하지 않으면 기본적으로 None과 np.nan을 결측값으로 처리합니다.

 

na_filter

na_filter 매개변수는 결측값이 포함된 행을 제거할지 여부를 지정합니다. na_filter 매개변수를 True로 설정하면 결측값이 포함된 행이 제거됩니다.

예제

다음은 read_csv() 함수를 사용하여 CSV 파일을 데이터프레임으로 읽어오는 예제입니다.

import pandas as pd

df = pd.read_csv('data.csv')

이 경우 data.csv 파일의 age 열에 NaN 값이 포함되어 있으면 age 열의 값이 NaN인 행이 데이터프레임에 포함됩니다.

 

na_values 활용

na_values 매개변수를 사용하여 NaN 값을 -1로 처리할 수 있습니다.

df = pd.read_csv('data.csv', na_values=['-1'])

이 경우 data.csv 파일의 age 열에 Nan 값이 포함되어 있으면 age 열의 값이 -1인 행이 데이터프레임에 포함됩니다.

 

na_filter 활용

na_filter 매개변수를 사용하여 결측값이 포함된 행을 제거할 수 있습니다.

df = pd.read_csv('data.csv', na_filter=True)

이 경우 data.csv 파일의 age 열에 NaN 값이 포함된 행이 데이터프레임에서 제거됩니다.

 

저작자표시 비영리 변경금지 (새창열림)

'파이썬 > Pandas' 카테고리의 다른 글

Pandas에서 SettingWithCopy 에러 발생 원인과 해결 방법  (0) 2024.01.26
Pandas : DataFrame 합치기  (2) 2024.01.22
ValueError: Cannot mask with non-boolean array containing NA / NaN values  (0) 2024.01.20
Pandas 데이터 필터링 : 원하는 데이터만 골라내기  (0) 2024.01.19
Pandas DataFrame의 행을 순회하는 방법  (1) 2024.01.18
'파이썬/Pandas' 카테고리의 다른 글
  • Pandas에서 SettingWithCopy 에러 발생 원인과 해결 방법
  • Pandas : DataFrame 합치기
  • ValueError: Cannot mask with non-boolean array containing NA / NaN values
  • Pandas 데이터 필터링 : 원하는 데이터만 골라내기
코샵
코샵
나의 코딩 일기장
    반응형
  • 코샵
    끄적끄적 코딩 공방
    코샵
    • 분류 전체보기 (725)
      • 스마트팜 (0)
      • 상품 추천 (223)
      • MongoDB (4)
      • 하드웨어 (17)
      • 일기장 (4)
      • 파이썬 (130)
        • Basic (41)
        • OpenCV (8)
        • Pandas (15)
        • PyQT (3)
        • SBC(Single Board Computer) (1)
        • 크롤링 (14)
        • Fast API (29)
        • Package (6)
      • Unity (138)
        • Tip (41)
        • Project (1)
        • Design Pattern (8)
        • Firebase (6)
        • Asset (2)
      • Linux (4)
      • C# (97)
        • Algorithm (11)
        • Window (7)
      • TypeScript (51)
        • CSS (10)
      • Git (11)
      • SQL (5)
      • Flutter (10)
        • Tip (1)
      • System (1)
      • BaekJoon (6)
      • Portfolio (2)
      • MacOS (1)
      • 유틸리티 (1)
      • 서비스 (6)
      • 자동화 (3)
      • Hobby (10)
        • 물생활 (10)
        • 식집사 (0)
  • 인기 글

  • 태그

    devlife
    쇼핑몰리뷰
    Python
    상품 리뷰 크롤링
    codingtips
    리스트
    programmerlife
    ipcamera
    unity
    appdevelopment
    긴유통기한우유
    learntocode
    카페24리뷰
    믈레코비타멸균우유
    cv2
    라떼우유
    스크립트 실행 순서
    rtsp
    유니티
    codingcommunity
    list
    스크립트 실행
    파이썬
    스마트스토어리뷰
    리뷰이관
    리뷰관리
    programming101
    셀레니움
    C#
    카페24리뷰이관
  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코샵
저장된 파일을 데이터프레임으로 읽어올 때 na_values, na_filter 매개변수 활용하기
상단으로

티스토리툴바