python selenium+Firefox 模拟浏览器操作

Python安装selenium,配置火狐浏览器环境

    火狐浏览器直接从网上下载即可,

    geckodriver的下载链接:https://github.com/mozilla/geckodriver/releases

下载完毕后,将火狐浏览器安装,安装为默认的地址 C:\Program Files\Mozilla Firefox;安装完成后,将火狐浏览器打开,配置selenium IDE插件。

 

第一步:打开火狐浏览器,找到最右边的菜单,选择附加组件,如图所示:

 

 

 

第二步:打开附件组件,选择“获取附件组件”,在搜索框中搜索selenium IDE

 

 

 第三步:找到selenium IDE添加到Firefox,进行安装;

 

 

第四步:安装过后,重新启动浏览器,在工具列表下就会出现Selenium IDE;

selenium IDE的插件就安装好了,点击启用就可以录制脚本了。

 

第五步:将下载好的geckodriver解压后,将geckodriver.exe放在安装过火狐浏览器的目录下,C:\Program Files\Mozilla Firefox

  

 

这时,再次编译代码,就可以成功了。。。。。。。。。

import json
import re
import time

from bs4 import BeautifulSoup
from selenium import webdriver

from selenium.webdriver.firefox.firefox_binary import FirefoxBinary


brower = webdriver.Firefox(executable_path=r'C:\Program Files\Mozilla Firefox\geckodriver.exe')

#打开百度搜索
brower.get("http://www.baidu.com")
#将查询条件赋值给查询文本框
brower.find_element_by_id('kw').send_keys('selenium')
#点击查询操作
brower.find_element_by_id('su').click()
#等待3秒,页面内容太多,有时加载比较慢
time.sleep(3)
#获取当前查询页面所有数据
html=brower.page_source

content=BeautifulSoup(html,'html5lib')
row4=content.select("#4")[0]
#打印第4条查询结果
print(row4)

pattern = re.compile(" class=\"c-abstract\">(.+?)<em>", re.S)
ressource = re.findall(pattern, str(row4))[0]
#打印第4条查询结果的内容
print(ressource)
brower.close()
 
      

猜你喜欢

转载自blog.csdn.net/hezheqiang/article/details/80881776