Selenium用法详解【调用JavaScript】【JAVA爬虫】

简介

本文主要讲解java 利用Selenium 操作浏览器网站时候,需要用的js的地方,代码该如何实现。

调用JavaScript

webdriver 对于滚动条的处理需要用到 JavaScript ,同时也可以向 textarea 文本框中输入文本( webdriver 只能定位,不能输入文本),webdriver 中使用execute_script方法实现 JavaScript 的执行。

滑动滚动条

通过 x ,y 坐标滑动

对于这种通过坐标滑动的方法,我们需要知道做表的起始位置在页面左上角(0,0),下面看一下示例,滑动 CSDN 首页。


import org.openqa.selenium.*;
import org.openqa.selenium.chrome.ChromeDriver;

import java.io.IOException;

public class SeleniumDemo {
    private final static String webDriver = "webdriver.chrome.driver";
    private final static String webDriverPath ="E:\\chromedriver\\chromedriver.exe";


    public static void main(String[] args) throws InterruptedException, IOException {
        System.setProperty(webDriver, webDriverPath);
        WebDriver driver= new ChromeDriver();
        driver.get("https://blog.csdn.net/");
        Thread.sleep(2000);
        JavascriptExecutor jse= (JavascriptExecutor)driver;
        //滑动到距离顶部500px的位置
        jse.executeScript("window.scrollTo(0,500);");
    }


}

通过参照标签滑动


import org.openqa.selenium.*;
import org.openqa.selenium.chrome.ChromeDriver;

import java.io.IOException;

public class SeleniumDemo {
    private final static String webDriver = "webdriver.chrome.driver";
    private final static String webDriverPath ="E:\\chromedriver\\chromedriver.exe";


    public static void main(String[] args) throws InterruptedException, IOException {
        System.setProperty(webDriver, webDriverPath);
        WebDriver driver= new ChromeDriver();
        driver.get("https://blog.csdn.net/");
        Thread.sleep(2000);
        JavascriptExecutor jse= (JavascriptExecutor)driver;
        //i要从1开始,否则 div["+i+"] 要写成div["+(i+1)+"]
        for (int i = 1; i < 20; i++) {
            Thread.sleep(1000);
            //定位文章的元素
            WebElement element=driver.findElement(By.xpath("//div[@class='Community']/div["+i+"]"));
            //滑动到指定元素位置
            jse.executeScript("arguments[0].scrollIntoView();", element);
        }

    }


}

通过循环的方式,从第一个文章的位置,依次滑倒到第20个文章的位置。

按钮点击

有些网站设置的反扒机制,通过 element.click()的方法,有时候浏览器页面的元素没有加载完之前,会报错,必须元素不能点击的错误,虽然selenium可以设置元素等待,等元素加载完毕,再点击,但是有些点击是由网页中加载的js控制的点击事件。也就是说,你的点击按钮,html\css执行完了,在页面上渲染出来一个点击按钮,但是 有一些js代码还么加载完毕,如果你此时去点击按钮,就会报错或者不执行,主要有两种情况,一是,按钮的点击事件,在这个js里写着,js没加载完你点击的话会没有反应。

二是,有些js会事件会会向网页插入html的元素代码,导致你定位好按钮元素位置发生的变化(把按钮元素挤到别的位置),你去点击的时候,执行点击的位置,已经不是按钮位置了,点击到了别的元素报错了。

   //指定元素位置执行js点击事件
    jse.executeScript("arguments[0].click();", element);

打开新窗口

 //新标签页打开
String  js = "window.open('https://tarzan.blog.csdn.net/')";
JavascriptExecutor jse= (JavascriptExecutor)driver;
jse.executeScript(js);

猜你喜欢

转载自blog.csdn.net/weixin_40986713/article/details/128605928
今日推荐