Python: uso básico del módulo de selenio

1. ¿Qué es un módulo de selenio?  
- Un módulo para la automatización basada en navegador. (Al escribir código, deje que el navegador complete la acción de automatización de la operación) 
El módulo de selenio puede ayudarnos a obtener fácilmente datos cargados dinámicamente 2. Proceso de uso de Selenio: 
- Instalación del entorno 
- Descargar un controlador de navegador (Google Chrome) 
- Ruta de descarga: http:/ /chromedriver.storage.googleapis.com/index.html 
- Correspondencia entre el controlador y el navegador: http://blog.csdn.net/huilan_same/article/details/51896672 
 Después de la descarga, puede llamar. 3. Pasos: 
1. Primero determine si la página tiene datos cargados dinámicamente. 
2. Corresponda a la respuesta a través de la herramienta de captura de paquetes y realice una búsqueda global en el paquete de datos. ¿Cómo obtener datos cargados dinámicamente? 
1. Selenium puede ayudarnos a obtener fácilmente datos cargados dinámicamente 
2. Realice un inicio de sesión simulado (como Renren, qq inicio de sesión simulado) para facilitar el inicio de sesión simulado








 

Ejemplo: instanciar un objeto:

from selenium import webdriver
from lxml import etree
from time import sleep
#实例化一个浏览器对象(传入浏览器的驱动对象
bro = webdriver.Chrome(executable_path='./chromedriver') #括号里跟一个参数,然后返回一个bro

        # - 接下来就可以编写基于浏览器自动化的操作代码了

bro.get('http://125.35.6.84:81/xk/')#让浏览器发起一个指定url对应请求

#获取浏览器当前页面的源码数据(动态)
page_text=bro.page_source    #这是一个属性,返回这个页面的page_text,可以帮我们获取当前页面所对应的源码数据

#解析数据,可以用xpath啦
tree=etree.HTML(page_text)
li_list=tree.xpath('.//ul[@id="gzlist"]/li')   #这个xpath返回的是一个列表,列表存的是ul标签
for li in li_list:
    name=li.xpath('./dl/@title')[0]
    print(name)
    # - 运行完之后可以关闭,但是关闭之前可以让他停留一段时间再关闭,记得导入sleep
sleep(5)  #停留5秒之后再关闭
bro.quit()

4. Selenium tiene más operaciones basadas en la automatización 
Abra Taobao, luego ingrese un nombre de producto en el cuadro de búsqueda y luego haga clic en el cuadro de búsqueda para permitirle buscar 
      - iniciar una solicitud: obtener (url) 
      - posicionamiento de la etiqueta: encontrar métodos de serie 
      - etiqueta interacción: send_keys('xxx') 
      - ejecutar el programa js: execute_script('jsCode') 
      - avanzar, retroceder: atrás(),forword() 
      - cerrar el navegador: quit()

Supongo que te gusta

Origin blog.csdn.net/leowutooo/article/details/124998342
Recomendado
Clasificación