Selenium no tiene una operación de interfaz para operar automáticamente el navegador para comprender

" Rastreador de selenio automático sin interfaz de operación del navegador "

Aprendí a usar selenio para manejar el navegador antes y hacer operaciones

Para obtener más información, consulte: navegador de operación automatizada de selenium

Pero el selenio siempre abrirá un navegador, esta vez veremos una forma de automatizar las operaciones sin abrir el navegador.

Nota: Esta operación debe basarse en el establecimiento exitoso del entorno anterior, por lo que primero debe comprender el funcionamiento automático del navegador.

01, obtenga contenido web sin interfaz

 

De hecho, la operación sin interfaz es solo para agregar un fragmento de código sobre la base de la operación de la interfaz, pero el aspecto general es un poco noble. Además, el uso de operaciones sin interfaz es un poco más en términos de rastreo. El elemento deseado se puede obtener directamente mediante varios posicionamientos.


Agregue una línea importante de código sobre la base del navegador de operación de la interfaz, y aquí debe usar un complemento:

driver=webdriver.PhantomJS("phantomjs插件路径")

Puede usarlo para obtener la información de la interfaz:

from selenium import webdriver
driver=webdriver.PhantomJS()
#url打开的要打开的网址
driver.get(url="http://www.baidu.com")
driver.page_source()

Entonces la operación es la misma que antes, pero hay un código más.

 

02 — contenido de extracto de selenio

Se realiza la operación sin interfaz para obtener información de la página, ¡y luego cómo obtener el contenido especificado!

La operación sigue siendo la misma que la operación anterior, captura de pantalla, posicionamiento, estos son los mismos.

Para obtener el contenido especificado que desea, solo necesita hacer esto:

Según el método de posicionamiento anterior: luego agregue

.text()

Veamos un ejemplo específicamente:

from selenium import webdriver

driver=webdriver.PhantomJS()
#url打开的要打开的网址
driver.get(url="http://www.baidu.com")
driver.page_source()#获取页面html
#通过id定位元素并获取定位的内容
driver.find_element_by_id("su").text()
#获取id为'su'的元素的内容

¿Ese problema está resuelto?

La cuenta oficial detrás del escenario responde "navegador sin operación de interfaz" para obtener complementos relacionados.

 

¡Sigue la cuenta oficial para obtener más contenido!

sugerencia relacionada:

Abre automáticamente el navegador, operación automática.

Estas imágenes son demasiado hermosas, quiero una buena descarga lenta, cómo romper en línea, ¡urgente! ! ! !

Descarga imágenes ya no tienes que hacerlo tú mismo

Supongo que te gusta

Origin blog.csdn.net/qq_39046854/article/details/83722072
Recomendado
Clasificación