파이썬 pandas : 시리즈와 데이터프레임란?

2023. 3. 30. 10:07·파이썬/Pandas
반응형
pandas 모듈에서 가장 중요한 클래스는 시리즈(Series)와 데이터프레임(DataFrame)입니다. 시리즈는 1차원 데이터를 다루는 데 사용되며, 데이터프레임은 2차원 데이터를 다루는 데 사용됩니다.

시리즈 클래스

시리즈 클래스를 정의하려면 다음과 같이 코드를 작성합니다.

import pandas as pd

s = pd.Series([1, 2, 3, 4, 5])

위 코드에서 pd.Series() 함수는 시리즈 객체를 생성합니다. 시리즈 객체는 인덱스와 값을 가집니다. 시리즈 객체를 출력하면 다음과 같이 나타납니다.

0    1
1    2
2    3
3    4
4    5
dtype: int64


데이터프레임 클래스

데이터프레임 클래스를 정의하려면 다음과 같이 코드를 작성합니다.

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M']}

df = pd.DataFrame(data)

위 코드에서 pd.DataFrame() 함수는 데이터프레임 객체를 생성합니다. 데이터프레임 객체는 행과 열로 구성됩니다. 데이터프레임 객체를 출력하면 다음과 같이 나타납니다.

       name  age gender
0     Alice   25      F
1       Bob   32      M
2   Charlie   18      M
3     David   47      M


데이터 조작

pandas 모듈은 다양한 데이터 조작 기능을 제공합니다. 예를 들어, 시리즈나 데이터프레임 객체의 인덱싱, 슬라이싱, 필터링, 그룹화, 합계, 평균 등 다양한 조작이 가능합니다.

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 인덱싱
print(df.loc[0])

# 슬라이싱
print(df.iloc[1:3])

# 필터링
print(df[df['age'] > 30])

# 그룹화
print(df.groupby('gender').mean())

위 코드에서 df.loc[0]는 첫 번째 행을 출력합니다. df.iloc[1:3]는 두 번째부터 세 번째 행까지 출력합니다. df[df['age'] > 30]는 나이가 30보다 큰 데이터를 출력합니다. df.groupby('gender').mean()은 성별로 그룹화하여 각 그룹의 평균을 출력합니다.


데이터프레임 파일로 저장

데이터프레임 객체를 파일로 저장하려면 다음과 같이 코드를 작성합니다.

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'gender': ['F', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# CSV 파일로 저장
df.to_csv('data.csv', index=False)

# Excel 파일로 저장
df.to_excel('data.xlsx', index=False)

위 코드에서 df.to_csv() 함수는 데이터프레임 객체를 CSV 파일로 저장합니다. df.to_excel() 함수는 데이터프레임 객체를 Excel 파일로 저장합니다.


결론

이상으로 파이썬 pandas 모듈의 시리즈와 데이터프레임 클래스에 대해 알아보았습니다. pandas 모듈은 데이터 분석에 필수적인 라이브러리이며, 다양한 데이터 조작 방법을 제공합니다.

저작자표시 비영리 변경금지 (새창열림)

'파이썬 > Pandas' 카테고리의 다른 글

Pandas DataFrame에서 열 삭제하기  (1) 2024.01.15
파이썬 pandas : 인덱스 조작 방법  (0) 2023.04.01
파이썬 Pandas 데이터프레임 합성 방법  (0) 2023.03.31
파이썬 pandas 모듈이란?  (0) 2023.03.29
Pandas DataFrame - 판다스 데이터프레임 생성 및 조회  (0) 2022.03.24
'파이썬/Pandas' 카테고리의 다른 글
  • 파이썬 pandas : 인덱스 조작 방법
  • 파이썬 Pandas 데이터프레임 합성 방법
  • 파이썬 pandas 모듈이란?
  • Pandas DataFrame - 판다스 데이터프레임 생성 및 조회
코샵
코샵
나의 코딩 일기장
    반응형
  • 코샵
    끄적끄적 코딩 공방
    코샵
  • 전체
    오늘
    어제
    • 분류 전체보기 (513) N
      • 상품 추천 (33) N
      • MongoDB (4)
      • 하드웨어 (1) N
      • 일기장 (4)
      • Unity (138)
        • Tip (41)
        • Project (1)
        • Design Pattern (8)
        • Firebase (6)
        • Asset (2)
      • 파이썬 (127)
        • Basic (40)
        • OpenCV (8)
        • Pandas (15)
        • PyQT (3)
        • SBC(Single Board Computer) (1)
        • 크롤링 (14)
        • Fast API (29)
        • Package (6)
      • Linux (4)
      • C# (97)
        • Algorithm (11)
        • Window (7)
      • TypeScript (48)
        • CSS (10)
      • Git (11)
      • SQL (5)
      • Flutter (10)
        • Tip (1)
      • System (1)
      • BaekJoon (6)
      • Portfolio (2)
      • MacOS (1)
      • 유틸리티 (1)
      • 서비스 (6)
      • 자동화 (3)
      • Hobby (10)
        • 물생활 (10)
        • 식집사 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

    • 다비즈
  • 공지사항

  • 인기 글

  • 태그

    카페24리뷰
    스마트스토어리뷰
    리스트
    유니티
    programmerlife
    unity
    Python
    list
    카페24리뷰이관
    믈레코비타멸균우유
    codingtips
    C#
    ipcamera
    learntocode
    파이썬
    상품 리뷰 크롤링
    programming101
    셀레니움
    라떼우유
    스크립트 실행
    cv2
    리뷰관리
    rtsp
    리뷰이관
    스크립트 실행 순서
    appdevelopment
    devlife
    긴유통기한우유
    쇼핑몰리뷰
    codingcommunity
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코샵
파이썬 pandas : 시리즈와 데이터프레임란?
상단으로

티스토리툴바