Selenium n'a pas d'opération d'interface pour faire fonctionner automatiquement le navigateur pour comprendre

" Robot d'exploration de sélénium sans interface de navigateur automatique "

J'ai déjà appris à utiliser le sélénium pour piloter le navigateur et effectuer des opérations

Pour plus de détails, veuillez consulter: navigateur d'opérations automatisées sélénium

Mais le sélénium ouvrira toujours un navigateur. Cette fois, nous allons chercher un moyen d'automatiser les opérations sans ouvrir le navigateur.

Remarque: Cette opération doit être basée sur l'établissement réussi de l'environnement précédent, vous devez donc d'abord comprendre le fonctionnement automatique du navigateur.

01, obtenez du contenu Web sans interface

 

En fait, l'opération sans interface consiste simplement à ajouter un morceau de code sur la base de l'opération d'interface, mais l'aspect général est un peu noble. De plus, l'utilisation d'opérations sans interface est un peu plus en termes de crawling. L'élément souhaité peut être obtenu directement par divers positionnement.


Ajoutez une ligne de code importante sur la base du navigateur d'opération d'interface, et ici vous devez utiliser un plug-in:

driver=webdriver.PhantomJS("phantomjs插件路径")

Vous pouvez l'utiliser pour obtenir les informations d'interface:

from selenium import webdriver
driver=webdriver.PhantomJS()
#url打开的要打开的网址
driver.get(url="http://www.baidu.com")
driver.page_source()

Ensuite, l'opération est la même que précédemment, mais il y a encore un code.

 

02 - teneur en extrait de sélénium

L'opération sans interface pour obtenir les informations de la page est terminée, alors comment obtenir le contenu spécifié!

L'opération est toujours la même que l'opération précédente, capture d'écran, positionnement, ce sont les mêmes.

Pour obtenir le contenu spécifié que vous souhaitez, il vous suffit de faire ceci:

Selon la méthode de positionnement précédente: puis ajoutez

.text()

Regardons un exemple en particulier:

from selenium import webdriver

driver=webdriver.PhantomJS()
#url打开的要打开的网址
driver.get(url="http://www.baidu.com")
driver.page_source()#获取页面html
#通过id定位元素并获取定位的内容
driver.find_element_by_id("su").text()
#获取id为'su'的元素的内容

Ce problème est-il résolu?

Le compte officiel répond en coulisses "aucun navigateur d'opération d'interface" pour obtenir les plug-ins associés.

 

Suivez le compte officiel pour obtenir plus de contenu!

suggestion connexe:

Ouvrir automatiquement le navigateur, fonctionnement automatique

Ces photos sont trop belles, veulent un bon téléchargement lent, comment se briser en ligne, urgent! ! ! !

Le téléchargement d'images n'a plus à faire vous-même

Je suppose que tu aimes

Origine blog.csdn.net/qq_39046854/article/details/83722072
conseillé
Classement