데이타 사이언스
웹크롤링을 위한 환경설정 및 검색어 자동실행
IT1004
2020. 2. 2. 17:33
1. 웹크롤링 준비
- Beautiful Soup 설치 (pip install bs4)
- selenium 패키지 설치 (pip install selenium)
- - 사람을 대신해서 주어진 작업을 작업해 주는 프로그램
- selenium 패키지가 사용할 웹 브라우저 프로그램(웹 드라이버)을 설치한다.
- - https://chromedriver.storage.googleapis.com/index.html?path=2.40/
https://chromedriver.storage.googleapis.com/index.html?path=2.40/
chromedriver.storage.googleapis.com
원하는 OS용 크롬 드라이버를 눌러서 원하는 폴더에 다운로드 한다.
2. 검색어 자동 실행
소스
from bs4 import BeautifulSoup
from selenium import webdriver
import time
query_txt = input('크롤링할 키워드는 무엇입니까?')
path = "G:/py_test/chromedriver_240/chromedriver.exe"
driver = webdriver.Chrome(path)
driver.get("https://korean.visitkorea.or.kr/main/main.do ")
time.sleep(2)
driver.find_element_by_id("btnSearch").click()
element = driver.find_element_by_id("inp_search")
element.send_keys(query_txt)
driver.find_element_by_link_text("검색").click()
샐행
결과 : 실행후 자동으로 실행 결과 창이 뜬다.