끄적끄적 코딩 공방

Pandas는 Python에서 데이터 분석을 위한 강력한 도구입니다. 하지만, Pandas를 사용하면서 종종 발생하는 에러 중 하나가 바로 SettingWithCopy 에러입니다. 이 에러는 무엇이고, 어떻게 해결할 수 있을까요? 1. SettingWithCopy 에러란? SettingWithCopy 에러는 Pandas의 DataFrame 또는 Series에서 값을 변경할 때 발생하는 에러입니다. 이 에러가 발생하는 이유는 DataFrame 또는 Series는 기본적으로 얕은 복사를 수행하기 때문입니다. 얕은 복사는 원본 데이터의 참조를 복사하는 것으로, 원본 데이터가 변경되면 복사본도 변경됩니다. 예를 들어, 다음과 같은 코드를 실행하면 SettingWithCopy 에러가 발생합니다. df = pd.D..

파이썬 딕셔너리는 키와 값의 쌍으로 구성된 데이터 구조입니다. 딕셔너리에 키값이 있는지 검사하는 방법은 다음과 같습니다. 1. in 연산자 in 연산자를 사용하여 키값이 딕셔너리에 있는지 검사할 수 있습니다. in 연산자의 결과는 True 또는 False입니다. dic = {"name": "John Doe", "age": 30} "name" in dic # True "address" in dic # False 2. get() 메서드 get() 메서드를 사용하여 키값이 딕셔너리에 있는지 검사할 수 있습니다. get() 메서드의 인자로 키값을 지정하면, 키값이 딕셔너리에 있으면 값을 반환하고, 없으면 None을 반환합니다. dic = {"name": "John Doe", "age": 30} dic.get("..

셀레니움을 사용하여 웹 페이지의 입력 필드에 텍스트를 입력하거나 특수 키를 사용하여 웹 페이지와 상호작용할 수 있습니다. 이러한 기능을 수행하는 데 핵심적인 역할을 하는 것이 바로 selenium.webdriver.common.keys 모듈입니다. 1. 키 입력: send_keys 메서드 활용 WebElement를 찾은 후, send_keys() 메서드를 사용하여 해당 요소에 키 입력을 전송할 수 있습니다. 이 메서드는 텍스트 문자열뿐만 아니라 키보드의 특수 키도 지원합니다. from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys driver..

웹 브라우저를 제어하여 자동화 작업을 수행하는 셀레니움은 웹 개발자와 테스터에게 필수적인 도구입니다. 셀레니움의 핵심 요소 중 하나는 WebElement입니다. 이번 글에서는 WebElement에 대해 자세히 살펴보고, 웹 페이지 요소를 다루는 다양한 기능을 알아보겠습니다. 1. WebElement란? WebElement는 웹 페이지의 구성 요소를 나타내는 객체입니다. 버튼, 입력 필드, 링크, 이미지 등 웹 페이지상의 모든 상호작용 가능한 요소는 WebElement로 표현됩니다. 셀레니움은 이러한 요소를 식별하고 조작하기 위한 다양한 메서드를 제공합니다. 2. 요소 찾기: 검색 메소드 활용 WebElement를 찾는 방법은 여러 가지가 있습니다. 가장 일반적인 방법은 다음과 같습니다. By.ID: 요소..

데이터 분석에서 여러 개의 데이터 세트를 결합하는 것은 흔한 일입니다. Pandas는 이를 위해 다양한 DataFrame 연결 메서드를 제공합니다. 이번 글에서는 두 개의 DataFrame 연결에 초점을 맞춰, 유용한 방법과 주의 사항을 살펴보겠습니다. 1. Merge : 공통 열 기준으로 결합 두 개의 DataFrame이 공통 열을 가지고 있을 때, 해당 열을 기준으로 데이터를 합병할 수 있습니다. 가장 일반적인 방법은 merge() 메서드 사용입니다. df1 = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 28]}) df2 = pd.DataFrame({'name': ['Alice', 'Charlie'], 'city': ['Se..

Pandas에서는 read_csv(), read_excel(), read_json() 등의 함수를 사용하여 저장된 파일을 데이터프레임으로 읽어올 수 있습니다. 이러한 함수에는 na_values와 na_filter 매개변수를 사용하여 결측값을 처리할 수 있습니다. na_values na_values 매개변수는 결측값으로 처리할 값을 지정합니다. na_values 매개변수를 지정하지 않으면 기본적으로 None과 np.nan을 결측값으로 처리합니다. na_filter na_filter 매개변수는 결측값이 포함된 행을 제거할지 여부를 지정합니다. na_filter 매개변수를 True로 설정하면 결측값이 포함된 행이 제거됩니다. 예제 다음은 read_csv() 함수를 사용하여 CSV 파일을 데이터프레임으로 읽어오..

Pandas에서 mask() 메서드를 사용하여 데이터를 필터링할 때 다음과 같은 오류가 발생할 수 있습니다. ValueError: Cannot mask with non-boolean array containing NA / NaN values 이 오류는 mask() 메서드의 인자로 NaN 값이 포함된 비논리형 배열을 전달했을 때 발생합니다. mask() 메서드는 인자로 전달된 배열의 값이 True인 행만 반환하는데, NaN 값은 True 또는 False로 변환할 수 없기 때문입니다. 이 오류를 처리하기 위해서는 다음과 같은 방법을 사용할 수 있습니다. 결측값을 제거한 후 필터링 결측값을 제거한 후 mask() 메서드를 사용하여 필터링하면 오류가 발생하지 않습니다. df = df.dropna() df_fil..

셀레니움은 웹 브라우저를 제어하고 자동화하는 데 사용되는 오픈 소스 프레임워크입니다. 셀레니움4에서는 웹 페이지의 요소를 찾기 위해 find_element()와 find_elements() 메서드를 제공합니다. find_element() find_element() 메서드는 웹 페이지에서 지정한 조건과 일치하는 첫 번째 요소를 반환합니다. from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time driver = webdriver.Chrome() # 네이버 접속 및 페이지가 전부 로드 될 때 까지 3초간 대기 driver.ge..

티스토리툴바