데이타 사이언스

웹크롤링을 위한 환경설정 및 검색어 자동실행

IT1004 2020. 2. 2. 17:33

1. 웹크롤링 준비

 

  •  Beautiful Soup 설치 (pip install bs4)
  •  selenium 패키지 설치  (pip install selenium)
  •    - 사람을 대신해서 주어진 작업을 작업해 주는 프로그램
  •  selenium 패키지가 사용할 웹 브라우저 프로그램(웹 드라이버)을 설치한다.
  •   - https://chromedriver.storage.googleapis.com/index.html?path=2.40/
 

https://chromedriver.storage.googleapis.com/index.html?path=2.40/

 

chromedriver.storage.googleapis.com

 

 

 

크롬드라이버

   

원하는 OS용 크롬 드라이버를 눌러서 원하는 폴더에 다운로드 한다.

 

2. 검색어 자동 실행

 

소스

from bs4 import BeautifulSoup

from selenium import webdriver

import time


query_txt = input('크롤링할 키워드는 무엇입니까?')

path = "G:/py_test/chromedriver_240/chromedriver.exe"

driver = webdriver.Chrome(path)

driver.get("https://korean.visitkorea.or.kr/main/main.do ")

time.sleep(2)

driver.find_element_by_id("btnSearch").click()

element = driver.find_element_by_id("inp_search")

element.send_keys(query_txt)

driver.find_element_by_link_text("검색").click()

 

샐행 

 

실행시 검색어 입력

 

 

결과 : 실행후 자동으로 실행 결과 창이 뜬다.

 

실행 결과