1.第一步就是引入依赖
<!-- selenium -->
<groupId>org.seleniumhq.selenium</groupId>
<artifactId>selenium-java</artifactId>
<version>3.4.0</version>
</dependency>
2.由于火狐浏览器和谷歌浏览器的特殊原因,这两个浏览器的启动要依靠二进制的文件;
文件的链接如下:
链接:https://pan.baidu.com/s/1mhBcQBA 密码:3x3z
启动谷歌浏览器的代码如下:
System.setProperty("webdriver.chrome.driver", "D:\\selenium\\chromedriver.exe"); WebDriver driver = new ChromeDriver();
启动火狐浏览器的代码如下:
// 指定驱动的地址(火狐浏览器的驱动) System.setProperty("webdriver.gecko.driver", "D:\\firefox\\geckodriver.exe"); // /* // * 禁用图片(火狐) // */ // // 关图片 // FirefoxProfile firefoxProfile = new FirefoxProfile(); // firefoxProfile.setPreference("permissions.default.image", 2); // // // 关掉flash // firefoxProfile.setPreference("dom.ipc.plugins.enabled.libflashplayer.so", false); driver = new FirefoxDriver();
下面的不需要驱动: WebDriver driver = new HtmlUnitDriver();
获取到网页之后,就可以分析网页的结构,利用JSoup去解析就好;