파이썬/크롤링

셀레니움에서 페이지가 로딩이 될 때까지 기다리는 방법

코샵 2024. 1. 28. 10:26
반응형

셀레니움은 웹 브라우저를 제어하여 자동화된 테스트를 수행하는 데 사용되는 라이브러리입니다. 셀레니움을 사용하여 웹 페이지를 탐색하려면 먼저 해당 페이지가 완전히 로딩되어야 합니다.

셀레니움에서 페이지가 로딩이 될 때까지 기다리는 방법에는 여러 가지가 있습니다.

1. time.sleep() 함수 사용

가장 간단한 방법은 time.sleep() 함수를 사용하는 것입니다. 이 함수는 지정된 시간 동안 코드의 실행을 일시 중지합니다.

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://google.com")

# 10초 동안 기다립니다.
time.sleep(10)

# 페이지의 제목을 출력합니다.
print(driver.title)

이 코드는 Google 웹 페이지를 열고 10초 동안 기다립니다. 그런 다음 페이지의 제목을 출력합니다.

 

2. implicitly_wait() 메서드 사용

implicitly_wait() 메서드는 셀레니움이 요소를 찾을 때까지 기다리는 기본 시간을 설정합니다. 이 메서드는 페이지가 완전히 로딩되기 전에 요소를 찾는 경우를 방지하는 데 도움이 됩니다.

from selenium import webdriver

driver = webdriver.Chrome()
driver.implicitly_wait(10)

driver.get("https://google.com")

# 페이지의 제목을 출력합니다.
print(driver.title)

이 코드는 Google 웹 페이지를 열고 implicitly_wait() 메서드를 사용하여 10초의 기본 시간을 설정합니다. 그런 다음 페이지의 제목을 출력합니다.

 

3. WebDriverWait 클래스 사용

WebDriverWait 클래스는 특정 조건이 충족될 때까지 기다리는 데 사용할 수 있습니다. 이 클래스는 다음과 같은 두 가지 메서드를 제공합니다.

  • until() 메서드는 지정된 조건이 충족될 때까지 기다립니다.
  • until_not() 메서드는 지정된 조건이 충족되지 않을 때까지 기다립니다.
from selenium import webdriver

from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Chrome()

driver.get("https://google.com")

# 페이지의 제목이 "Google"이 될 때까지 기다립니다.
WebDriverWait(driver, 10).until(lambda x: x.title == "Google")

# 페이지의 제목이 "Google"이 아닐 때까지 기다립니다.
WebDriverWait(driver, 10).until_not(lambda x: x.title == "Google")

이 코드는 Google 웹 페이지를 열고 WebDriverWait 클래스의 until() 메서드를 사용하여 페이지의 제목이 "Google"이 될 때까지 기다립니다.

 

4. 자바스크립트 코드 사용

셀레니움은 자바스크립트를 사용하여 웹 페이지를 탐색하고 조작할 수 있습니다. 페이지가 로딩이 되었는지 확인하려면 다음과 같은 자바스크립트 코드를 사용할 수 있습니다.

script = """return document.readyState === 'complete';"""

# 로딩이 완료될 때까지 기다립니다.
while not driver.execute_script(script):
    pass

이 코드는 페이지의 상태가 "complete"일 때 까지 while문을 반복합니다.

 

셀레니움을 사용하여 페이지가 로딩이 될 때까지 기다리는 방법을 선택할 때에는 다음과 같은 요소를 고려해야 합니다.

  • 페이지의 복잡성
  • 페이지에 포함된 동적 요소의 수
  • 테스트의 성능

페이지가 복잡하고 동적 요소가 많이 포함되어 있다면 implicitly_wait() 메서드나 WebDriverWait 클래스를 사용하여 페이지가 완전히 로딩될 때까지 기다리는 것이 좋습니다. 테스트의 성능을 고려하여 적절한 기다림 시간을 설정해야 합니다.