반응형
로직
- 크롤링으로 획득한 음식점의 Place_Id로 블로그 리뷰 주소(url)을 찾고
- 블로그에 requests 요청을 해 획득한 text를 BeautifulSoup로 html 변환
- 데이터 파싱
수집한 데이터
- 블로그 글 제목
- 블로그 글 내용
- 글쓴이
- 작성 날짜
- 태그
- url
좋아요도 수집하려 하였으나, js를 실행하지 않으면 빈칸이다.
셀레니움을 사용하지 않아 속도가 매우 빠르지만, 블로그 url을 찾는 과정에서 매우 애를 먹었다.
현재 속도도 마음에 들지 않아 더욱 빠르게 할 수 있는 방법을 고민 해 봐야겠다
'Portfolio' 카테고리의 다른 글
네이버 지도를 통한 맛집 크롤링 : Portfolio (2) | 2024.01.30 |
---|