原理:
Selenium 是一个网页的自动化框架。通过它,我们可以写出自动化程序,像人一样在浏览器里操作web界面。比如点击界面按钮,在文本框中输入文字等操作。还能从web界面获取信息。比如获取12306票务信息,招聘网站职位信息等等。
Selenium组织提供了多种编程语言的Selenium客户端库,包括 Java,Python,JavaScript,Ruby等,方便不同编程语言的开发者使用。
安装:
1. Selenium库
Selenium环境的安装主要就是安装两样东西:客户端库和浏览器驱动。
安装Selenium库非常简单,打开命令行输入如下命令就可:
pip install selenium
也可以直接在IDE中如Pycharm中安装,如图:
2. 安装浏览器驱动(以谷歌浏览器为例)
先查看谷歌浏览器版本号,如图,在设置中点击"关于谷歌":
打开下面链接下载 Chrome 浏览器的驱动
Chrome浏览器驱动下载地址
打开目录下载对应系统的压缩包,如果我们是Windows平台的电脑,就下载 chromedriver_win32.zip
下载后解压里面的程序文件 chromedriver.exe 到Python的根目录(这样就不用配环境变量)
到此,环境搭建就完成了
简单代码示范:
以下的代码,可以自动打开Chrome浏览器,并且自动打开百度网站。
from selenium import webdriver
import time
# 创建 WebDriver 对象,指明使用chrome浏览器驱动
wd = webdriver.Chrome()
# 调用WebDriver 对象的get方法 可以让浏览器打开指定网址
wd.get('https://www.baidu.com')
# 休眠5秒后自动关闭
time.sleep(5)
wd.quit()