크롤링을 할 때 셀레니움이 필요한지 확인하는 방법

2024. 2. 3. 10:03·파이썬/크롤링
반응형

크롤링을 할 때 셀레니움이 필요한지 확인하는 방법은 크게 두 가지가 있습니다.

 

자바스크립트 사용 중지

웹 브라우저의 개발자 도구에서 자바스크립트를 사용 중지하고 페이지를 확인하는 방법입니다. 자바스크립트가 사용 중지되면 웹 페이지의 동적인 요소가 모두 숨겨지고, 정적 요소만 표시됩니다. 따라서, 페이지의 내용을 정적 요소만으로 추출할 수 있다면 셀레니움이 필요하지 않습니다.

개발자 도구에서 자바스크립트 사용 중지 방법

크롬 브라우저의 경우 다음과 같은 방법으로 개발자 도구에서 자바스크립트 사용을 중지할 수 있습니다.

  1. 크롬 브라우저에서 페이지를 열고, F12 키를 누릅니다.
  2. 개발자 도구가 열리면,  환경설정을 선택합니다.
  3. 디버거 항목의 자바스크립트 사용 중지(Disable JavaScript) 체크박스를 선택합니다.

자바스크립트 사용을 중지하면, 페이지의 내용이 다음과 같이 변경됩니다.

페이지의 내용을 정적 요소만으로 추출할 수 있다면 셀레니움이 필요하지 않습니다.

 

페이지 소스보기

웹 페이지의 소스 코드를 확인하여 셀레니움이 필요한지 확인하는 방법입니다. 페이지의 소스 코드를 확인하면 페이지에 사용된 HTML, CSS, 자바스크립트 코드를 확인할 수 있습니다.

페이지의 소스 코드를 확인하는 방법은 웹 브라우저마다 다릅니다.

크롬 브라우저의 경우 오른쪽 마우스 클릭을 한 후 페이지 소스 보기를 선택해 확인 할 수 있습니다.

페이지의 소스 코드를 확인하여 다음과 같은 요소가 있는지 확인합니다.

  • 자바스크립트로 생성된 요소
  • 스크롤바
  • 팝업 창

이러한 요소가 있는 경우 셀레니움이 필요합니다. 이러한 요소는 자바스크립트로 제어되므로, 셀레니움을 사용하지 않고는 페이지의 내용을 추출할 수 없습니다.

 

저작자표시 비영리 변경금지 (새창열림)

'파이썬 > 크롤링' 카테고리의 다른 글

Requests : HTTP 요청 최적화  (0) 2024.02.06
크롤링이 가능한 사이트인지 확인하는 방법  (1) 2024.02.04
Selenium 4.1.0에서 headless 설정 변경  (0) 2024.02.01
셀레니움 최적화를 위한 chrome_options  (0) 2024.01.30
셀레니움에서 이미지 비활성화 : 최적화  (0) 2024.01.29
'파이썬/크롤링' 카테고리의 다른 글
  • Requests : HTTP 요청 최적화
  • 크롤링이 가능한 사이트인지 확인하는 방법
  • Selenium 4.1.0에서 headless 설정 변경
  • 셀레니움 최적화를 위한 chrome_options
코샵
코샵
나의 코딩 일기장
    반응형
  • 코샵
    끄적끄적 코딩 공방
    코샵
    • 분류 전체보기 (725)
      • 스마트팜 (0)
      • 상품 추천 (223)
      • MongoDB (4)
      • 하드웨어 (17)
      • 일기장 (4)
      • 파이썬 (130)
        • Basic (41)
        • OpenCV (8)
        • Pandas (15)
        • PyQT (3)
        • SBC(Single Board Computer) (1)
        • 크롤링 (14)
        • Fast API (29)
        • Package (6)
      • Unity (138)
        • Tip (41)
        • Project (1)
        • Design Pattern (8)
        • Firebase (6)
        • Asset (2)
      • Linux (4)
      • C# (97)
        • Algorithm (11)
        • Window (7)
      • TypeScript (51)
        • CSS (10)
      • Git (11)
      • SQL (5)
      • Flutter (10)
        • Tip (1)
      • System (1)
      • BaekJoon (6)
      • Portfolio (2)
      • MacOS (1)
      • 유틸리티 (1)
      • 서비스 (6)
      • 자동화 (3)
      • Hobby (10)
        • 물생활 (10)
        • 식집사 (0)
  • 인기 글

  • 태그

    list
    rtsp
    ipcamera
    programmerlife
    codingtips
    파이썬
    카페24리뷰이관
    상품 리뷰 크롤링
    믈레코비타멸균우유
    셀레니움
    unity
    cv2
    스크립트 실행
    리스트
    programming101
    리뷰관리
    쇼핑몰리뷰
    스마트스토어리뷰
    유니티
    긴유통기한우유
    C#
    리뷰이관
    스크립트 실행 순서
    Python
    codingcommunity
    라떼우유
    learntocode
    카페24리뷰
    appdevelopment
    devlife
  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코샵
크롤링을 할 때 셀레니움이 필요한지 확인하는 방법
상단으로

티스토리툴바