Resumen de datos de extracto de selenio con mapa mental

Resumen de datos de extracto de selenio con mapa mental

Inserte la descripción de la imagen aquí

1. Atributos y métodos comunes del objeto controlador

En el proceso de uso de selenio, después de crear una instancia del objeto controlador, el objeto controlador tiene algunos atributos y métodos de uso común

  1. driver.page_source El código fuente de la página web representada por el navegador de pestañas actual
  2. driver.current_url La URL de la pestaña actual
  3. driver.close() Cierre la pestaña actual, si solo hay una pestaña, cierre todo el navegador
  4. driver.quit() Cerrar el navegador
  5. driver.forward() Avanzar página
  6. driver.back() Página atrás
  7. driver.screen_shot(img_name) Captura de pantalla de la página

Puntos de conocimiento: comprender los atributos y métodos comunes del objeto controlador

2. El método para ubicar el elemento de etiqueta del objeto de controlador y obtener el objeto de etiqueta

Hay muchas formas de ubicar la etiqueta en selenium y devolver el objeto de elemento de etiqueta

find_element_by_id 						(返回一个元素)
find_element(s)_by_class_name 			(根据类名获取元素列表)
find_element(s)_by_name 				(根据标签的name属性值返回包含标签对象元素的列表)
find_element(s)_by_xpath 				(返回一个包含元素的列表)
find_element(s)_by_link_text 			(根据连接文本获取元素列表)
find_element(s)_by_partial_link_text 	(根据链接包含的文本获取元素列表)
find_element(s)_by_tag_name 			(根据标签名获取元素列表)
find_element(s)_by_css_selector 		(根据css选择器来获取元素列表)
  • Nota:
    • La diferencia entre find_element y find_elements:
      • Si hay más s, devuelve la lista, si no hay s, devuelve el primer objeto de etiqueta que coincide
      • Se lanzará una excepción si find_element no coincide, y se devolverá una lista vacía si find_elements no coincide.
    • La diferencia entre by_link_text y by_partial_link_tex: todo texto y que contiene un texto determinado
    • Cómo utilizar las funciones anteriores
      • driver.find_element_by_id('id_str')

Punto de conocimiento: dominar el método de localizar el elemento de etiqueta del objeto controlador y obtener el objeto de etiqueta

3. El objeto de etiqueta extrae el contenido de texto y los valores de los atributos.

find_element solo puede obtener el elemento, no los datos directamente, si necesita obtener los datos, debe utilizar los siguientes métodos

  • Realizar operaciones de clic en elementoselement.click()

    • Haga clic en el objeto de etiqueta de destino
  • Ingrese datos en el cuadro de entradaelement.send_keys(data)

    • Ingrese los datos para el objeto de etiqueta ubicado
  • Obtener textoelement.text

    • textObtenga el contenido del texto localizando las propiedades del objeto de etiqueta
  • Obtener valor de atributoelement.get_attribute("属性名")

    • get_attributeObtenga el valor del atributo localizando la función del objeto de etiqueta obtenido y pasando el nombre del atributo

  • El código se implementa de la siguiente manera:

    from selenium import webdriver
    
    driver = webdriver.Chrome()
    
    driver.get('http://www.itcast.cn/')
    
    ret = driver.find_elements_by_tag_name('h2')
    print(ret[0].text) # 
    
    ret = driver.find_elements_by_link_text('黑马程序员')
    print(ret[0].get_attribute('href'))
    
    driver.quit()
    

Inserte la descripción de la imagen aquí

Este es el final, si te ayuda, bienvenido a gustar y seguir, tus me gusta son muy importantes para mí

Supongo que te gusta

Origin blog.csdn.net/qq_45176548/article/details/111637850
Recomendado
Clasificación