반응형
파이썬 pandas는 데이터 분석을 위한 라이브러리입니다. 이를 사용하면 데이터를 쉽게 불러오고 조작할 수 있습니다. pandas는 NumPy와 함께 데이터 분석에 많이 사용됩니다.
pandas 모듈의 주요 기능
데이터 불러오기
pandas를 사용하면 다양한 데이터 소스에서 데이터를 불러올 수 있습니다. CSV, Excel, SQL 데이터베이스, JSON 등 다양한 형식의 데이터를 불러올 수 있습니다.
데이터 조작
pandas를 사용하면 데이터를 쉽게 조작할 수 있습니다. 데이터의 필터링, 정렬, 그룹화, 합계, 평균 등 다양한 조작이 가능합니다.
데이터 시각화
pandas를 사용하면 데이터를 시각화할 수 있습니다. Matplotlib과 함께 사용하면 다양한 그래프와 차트를 그릴 수 있습니다.
pandas 모듈 사용 예시
아래는 파이썬 pandas 모듈을 사용하여 CSV 파일을 불러오고 데이터를 조작하는 예시입니다.
import pandas as pd
# CSV 파일 불러오기
data = pd.read_csv('data.csv')
# 데이터 출력
print(data)
# 데이터 필터링
filtered_data = data[data['age'] > 30]
# 필터링된 데이터 출력
print(filtered_data)
# 데이터 그룹화
grouped_data = data.groupby('gender')
# 그룹화된 데이터 출력
print(grouped_data.mean())
# 데이터 시각화
import matplotlib.pyplot as plt
grouped_data.mean().plot(kind='bar')
plt.show()
위 코드에서 pd.read_csv() 함수는 CSV 파일을 불러오는 함수입니다. data[data['age'] > 30]는 age 컬럼이 30보다 큰 데이터를 필터링하는 코드입니다. data.groupby('gender')는 gender 컬럼으로 데이터를 그룹화하는 코드입니다. grouped_data.mean().plot(kind='bar')는 그룹화된 데이터를 막대그래프로 시각화하는 코드입니다.
결론
이상으로 파이썬 pandas 모듈에 대해 알아보았습니다. pandas는 데이터 분석에 필수적인 라이브러리이며, 다양한 데이터 소스에서 데이터를 불러오고 조작하는 기능을 제공합니다. 또한 Matplotlib과 함께 사용하면 데이터를 시각화할 수 있습니다.
'파이썬 > Pandas' 카테고리의 다른 글
Pandas DataFrame에서 열 삭제하기 (1) | 2024.01.15 |
---|---|
파이썬 pandas : 인덱스 조작 방법 (0) | 2023.04.01 |
파이썬 Pandas 데이터프레임 합성 방법 (0) | 2023.03.31 |
파이썬 pandas : 시리즈와 데이터프레임란? (0) | 2023.03.30 |
Pandas DataFrame - 판다스 데이터프레임 생성 및 조회 (0) | 2022.03.24 |