Python: Grundlegende Verwendung des Selenium-Moduls

1. Was ist ein Selenmodul?  
- Ein Modul zur browserbasierten Automatisierung. (Lassen Sie den Browser durch das Schreiben von Code die Vorgangsautomatisierung abschließen.) 
Das Selenium-Modul kann uns dabei helfen, auf einfache Weise dynamisch geladene Daten zu erhalten. 2. Selenium-Nutzungsprozess: 
- Umgebungsinstallation 
- Laden Sie einen Browsertreiber herunter (Google Chrome) 
- Download-Pfad: http:/ /chromedriver.storage.googleapis.com/index.html 
- Entsprechung zwischen Treiber und Browser: http://blog.csdn.net/huilan_same/article/details/51896672 
 Nach dem Herunterladen können Sie anrufen. 3. Schritte: 
1. Stellen Sie zunächst fest, ob die Seite dynamisch geladene Daten enthält. 
2. Korrespondieren Sie mit der Antwort über das Paketerfassungstool und führen Sie eine globale Suche im Datenpaket durch. Wie erhalte ich dynamisch geladene Daten? 
1. Selenium kann uns dabei helfen, auf einfache Weise dynamisch geladene Daten zu erhalten. 
2. Führen Sie eine simulierte Anmeldung durch (z. B. Renren, qq simulierte Anmeldung), um die simulierte Anmeldung zu erleichtern








 

Beispiel: Ein Objekt instanziieren:

from selenium import webdriver
from lxml import etree
from time import sleep
#实例化一个浏览器对象(传入浏览器的驱动对象
bro = webdriver.Chrome(executable_path='./chromedriver') #括号里跟一个参数,然后返回一个bro

        # - 接下来就可以编写基于浏览器自动化的操作代码了

bro.get('http://125.35.6.84:81/xk/')#让浏览器发起一个指定url对应请求

#获取浏览器当前页面的源码数据(动态)
page_text=bro.page_source    #这是一个属性,返回这个页面的page_text,可以帮我们获取当前页面所对应的源码数据

#解析数据,可以用xpath啦
tree=etree.HTML(page_text)
li_list=tree.xpath('.//ul[@id="gzlist"]/li')   #这个xpath返回的是一个列表,列表存的是ul标签
for li in li_list:
    name=li.xpath('./dl/@title')[0]
    print(name)
    # - 运行完之后可以关闭,但是关闭之前可以让他停留一段时间再关闭,记得导入sleep
sleep(5)  #停留5秒之后再关闭
bro.quit()

4. Selenium verfügt über mehr automatisierungsbasierte Vorgänge. 
Öffnen Sie Taobao, geben Sie einen Produktnamen in das Suchfeld ein und klicken Sie dann auf das Suchfeld, um eine Suche zu starten 
      – eine Anfrage zu initiieren: get(url) 
      – Label-Positionierung: Serienmethoden finden 
      – Label Interaktion: send_keys('xxx') 
      - js-Programm ausführen:execute_script('jsCode') 
      - vorwärts, rückwärts: back(),forword() 
      - Browser schließen: quit()

Ich denke du magst

Origin blog.csdn.net/leowutooo/article/details/124998342
Empfohlen
Rangfolge