파이썬/Pandas

    Pandas DataFrame의 열 추가하기

    Pandas DataFrame에 열을 추가하는 방법은 크게 다음과 같이 다섯 가지가 있습니다. 할당 연산자를 사용해, 빈 문자열로 열 추가 .assign() 메서드로 빈 열 추가 .reindex() 메서드로 빈 열 추가 .insert() 메서드로 원본 데이터프레임에서 원하는 위치에 열 추가 .apply() 메서드로 빈 열 추가 할당 연산자 사용 가장 간단한 방법은 할당 연산자를 사용하여 빈 문자열로 열을 추가하는 것입니다. df = pd.DataFrame({'col1': [1, 2, 3]}) df['col2'] = '' print(df) col1 col2 0 1 1 2 2 3 이 방법은 열 이름과 열의 값을 지정할 수 있습니다. 열 이름은 문자열이어야 합니다. 열의 값은 리스트, NumPy 배열, Ser..

    Pandas DataFrame에서 열 삭제하기

    Pandas DataFrame에서 열을 삭제하는 방법은 두 가지가 있습니다. drop() 메서드 pop() 메서드 이 글에서는 drop() 메서드를 활용하여 열을 삭제하는 방법에 대해서 설명드리겠습니다. drop() 메서드 df.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise') labels: 삭제할 열 이름입니다. axis를 지정해주어야 합니다. axis: {0: index / 1: columns} labels 인수를 사용할 경우 지정할 축입니다. index: 인덱스명을 입력해서 바로 삭제를 할 수 있습니다. columns: 컬럼명을 입력해서 바로 삭제를 할 수 있습니다. level: ..

    파이썬 pandas : 인덱스 조작 방법

    파이썬 pandas 모듈은 데이터프레임을 다루는 데 유용한 함수들을 제공합니다. 데이터프레임의 인덱스를 조작하는 방법에 대해서 자세히 알아보겠습니다. 인덱스 설정 데이터프레임의 인덱스를 설정하려면 set_index() 함수를 사용합니다. 예를 들어, 다음과 같은 데이터프레임이 있다고 가정해봅시다. import pandas as pd df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 32, 18], 'gender': ['F', 'M', 'M']}) 이 데이터프레임의 인덱스를 name 열로 설정하려면 다음과 같이 코드를 작성합니다. df = df.set_index('name') 위 코드를 실행하면 다음과 같은 데이터프레임이 생성됩니다. ..

    파이썬 Pandas 데이터프레임 합성 방법

    Pandas는 데이터프레임을 합성하고 연결하는 데에 유용한 여러 함수를 제공합니다. 여기서는 concat, merge, join 함수를 사용하여 데이터프레임을 합성하는 방법에 대해 알아보겠습니다. 1. concat 함수 concat 함수는 두 개 이상의 데이터프레임을 연결하는 데 사용됩니다. 이 함수는 데이터프레임을 수직 또는 수평으로 연결할 수 있습니다. 예를 들어, 아래와 같이 두 개의 데이터프레임을 생성합니다. import pandas as pd # 데이터프레임 생성 df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', ..

    파이썬 pandas : 시리즈와 데이터프레임란?

    pandas 모듈에서 가장 중요한 클래스는 시리즈(Series)와 데이터프레임(DataFrame)입니다. 시리즈는 1차원 데이터를 다루는 데 사용되며, 데이터프레임은 2차원 데이터를 다루는 데 사용됩니다. 시리즈 클래스 시리즈 클래스를 정의하려면 다음과 같이 코드를 작성합니다. import pandas as pd s = pd.Series([1, 2, 3, 4, 5]) 위 코드에서 pd.Series() 함수는 시리즈 객체를 생성합니다. 시리즈 객체는 인덱스와 값을 가집니다. 시리즈 객체를 출력하면 다음과 같이 나타납니다. 0 1 1 2 2 3 3 4 4 5 dtype: int64 데이터프레임 클래스 데이터프레임 클래스를 정의하려면 다음과 같이 코드를 작성합니다. import pandas as pd data..

    파이썬 pandas 모듈이란?

    파이썬 pandas는 데이터 분석을 위한 라이브러리입니다. 이를 사용하면 데이터를 쉽게 불러오고 조작할 수 있습니다. pandas는 NumPy와 함께 데이터 분석에 많이 사용됩니다. pandas 모듈의 주요 기능 데이터 불러오기 pandas를 사용하면 다양한 데이터 소스에서 데이터를 불러올 수 있습니다. CSV, Excel, SQL 데이터베이스, JSON 등 다양한 형식의 데이터를 불러올 수 있습니다. 데이터 조작 pandas를 사용하면 데이터를 쉽게 조작할 수 있습니다. 데이터의 필터링, 정렬, 그룹화, 합계, 평균 등 다양한 조작이 가능합니다. 데이터 시각화 pandas를 사용하면 데이터를 시각화할 수 있습니다. Matplotlib과 함께 사용하면 다양한 그래프와 차트를 그릴 수 있습니다. panda..

    Pandas DataFrame - 판다스 데이터프레임 생성 및 조회

    설명 판다스 데이터 프레임은 데이터를 엑셀의 표(테이블) 형태로 처리 할 수 있어 데이터 전처리등 각종 데이터의 핸들링을 편하게 할 수 있는 라이브러리입니다. pip install pandas 판다스 라이브러리가 설치되어 있지 않은 상태면 먼저 라이브러리를 설치해주어야 합니다. 데이터프레임 생성 Columns 는 열이고 Index 는 행입니다. 현재 아무것도 지정해주지 않아 [] 으로 표현이 되었고 데이터도 없어 Empty DataFrame 라고 알려줬네요. DataFrame(data, index, columns, dtype, copy) 이런 구조를 가지고 있습니다. 인덱스, 칼럼, 데이터타입을 지정해 줄 수 있고 지정해주지 않는다면 data의 형태에 맞게 알아서 생성해줍니다. 인덱스와 칼럼을 지정해주지..