저장된 파일을 데이터프레임으로 읽어올 때 na_values, na_filter 매개변수 활용하기

2024. 1. 21. 11:09·파이썬/Pandas
반응형

Pandas에서는 read_csv(), read_excel(), read_json() 등의 함수를 사용하여 저장된 파일을 데이터프레임으로 읽어올 수 있습니다. 이러한 함수에는 na_values와 na_filter 매개변수를 사용하여 결측값을 처리할 수 있습니다.

 

na_values

na_values 매개변수는 결측값으로 처리할 값을 지정합니다. na_values 매개변수를 지정하지 않으면 기본적으로 None과 np.nan을 결측값으로 처리합니다.

 

na_filter

na_filter 매개변수는 결측값이 포함된 행을 제거할지 여부를 지정합니다. na_filter 매개변수를 True로 설정하면 결측값이 포함된 행이 제거됩니다.

예제

다음은 read_csv() 함수를 사용하여 CSV 파일을 데이터프레임으로 읽어오는 예제입니다.

import pandas as pd

df = pd.read_csv('data.csv')

이 경우 data.csv 파일의 age 열에 NaN 값이 포함되어 있으면 age 열의 값이 NaN인 행이 데이터프레임에 포함됩니다.

 

na_values 활용

na_values 매개변수를 사용하여 NaN 값을 -1로 처리할 수 있습니다.

df = pd.read_csv('data.csv', na_values=['-1'])

이 경우 data.csv 파일의 age 열에 Nan 값이 포함되어 있으면 age 열의 값이 -1인 행이 데이터프레임에 포함됩니다.

 

na_filter 활용

na_filter 매개변수를 사용하여 결측값이 포함된 행을 제거할 수 있습니다.

df = pd.read_csv('data.csv', na_filter=True)

이 경우 data.csv 파일의 age 열에 NaN 값이 포함된 행이 데이터프레임에서 제거됩니다.

 

저작자표시 비영리 변경금지 (새창열림)

'파이썬 > Pandas' 카테고리의 다른 글

Pandas에서 SettingWithCopy 에러 발생 원인과 해결 방법  (0) 2024.01.26
Pandas : DataFrame 합치기  (2) 2024.01.22
ValueError: Cannot mask with non-boolean array containing NA / NaN values  (0) 2024.01.20
Pandas 데이터 필터링 : 원하는 데이터만 골라내기  (0) 2024.01.19
Pandas DataFrame의 행을 순회하는 방법  (0) 2024.01.18
'파이썬/Pandas' 카테고리의 다른 글
  • Pandas에서 SettingWithCopy 에러 발생 원인과 해결 방법
  • Pandas : DataFrame 합치기
  • ValueError: Cannot mask with non-boolean array containing NA / NaN values
  • Pandas 데이터 필터링 : 원하는 데이터만 골라내기
코샵
코샵
나의 코딩 일기장
    반응형
  • 코샵
    끄적끄적 코딩 공방
    코샵
    • 분류 전체보기 (597) N
      • 상품 추천 (105) N
      • MongoDB (4)
      • 하드웨어 (9)
      • 일기장 (4)
      • Unity (138)
        • Tip (41)
        • Project (1)
        • Design Pattern (8)
        • Firebase (6)
        • Asset (2)
      • 파이썬 (12) N
        • Basic (41)
        • OpenCV (8)
        • Pandas (15)
        • PyQT (3)
        • SBC(Single Board Computer) (1)
        • 크롤링 (14)
        • Fast API (29)
        • Package (6)
      • Linux (4)
      • C# (97)
        • Algorithm (11)
        • Window (7)
      • TypeScript (50)
        • CSS (10)
      • Git (11)
      • SQL (5)
      • Flutter (10)
        • Tip (1)
      • System (1)
      • BaekJoon (6)
      • Portfolio (2)
      • MacOS (1)
      • 유틸리티 (1)
      • 서비스 (6)
      • 자동화 (3)
      • Hobby (10)
        • 물생활 (10)
        • 식집사 (0)
  • 인기 글

  • 태그

    programming101
    리뷰이관
    learntocode
    codingcommunity
    cv2
    유니티
    리스트
    C#
    스마트스토어리뷰
    라떼우유
    스크립트 실행 순서
    codingtips
    긴유통기한우유
    ipcamera
    rtsp
    상품 리뷰 크롤링
    appdevelopment
    카페24리뷰이관
    카페24리뷰
    리뷰관리
    Python
    unity
    list
    스크립트 실행
    programmerlife
    믈레코비타멸균우유
    셀레니움
    쇼핑몰리뷰
    devlife
    파이썬
  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코샵
저장된 파일을 데이터프레임으로 읽어올 때 na_values, na_filter 매개변수 활용하기
상단으로

티스토리툴바