selenium get()页面超时，捕获异常后，如何打开新的页面 - 代码天地

selenium get()页面超时，捕获异常后，如何打开新的页面

其他 2020-01-26 11:40:14 阅读次数: 0

selenium中，当我们一次性要爬取很多url时，当get()页面超时后，捕获异常后，还需要继续get()其他url页面，但是当你直接调用get()方法时，会报异常。此时解决方法有两种，一种是重启浏览器，另一种是浏览器保持有两个tag页，当超时是切换到另一个tag（注意：tag页是很容易加载的）

方法一：

from selenium import webdriver
import os
import re


class GetPage:
    def __init__(self, url_path):
        self.url_path = url_path
        self.driver = webdriver.Chrome()
        self.urls = {}
        self.url_flag = False
        self.driver.set_page_load_timeout(1)
        self.driver.set_script_timeout(1)

    def get_url(self):
        if os.path.exists(self.url_path):
            with open(self.url_path, 'r') as f:
                url = f.read()
                self.urls = re.split(',', url)
                print(self.urls)
                if len(self.urls):
                    self.url_flag = True
        else:
            print(self.url_path + " no exist")

    def close(self):
        self.driver.quit()

    def get_page(self):
        self.get_url()
        if self.url_flag:
            for url in self.urls:
                try:
                    self.driver.get(url)
                except:
                    print(url + " timeout")
                    self.driver.quit()
                    self.driver = webdriver.Chrome()
        self.close()


if __name__ == "__main__":
    get_url_list = GetPage("E:\\1.txt")
    get_url_list.get_page()

url文件格式如下：

方法二之后再续写！

IT小样

发布了39 篇原创文章 · 获赞 16 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_31315135/article/details/91039752

selenium get()页面超时，捕获异常后，如何打开新的页面

selenium 页面超时后捕获异常也无法继续get(url)使用的问题解决方案

selenium get()函数加载页面超时错误解决

selenium打开新弹出页面时，和几种情形

Python selenium webdriver设置加载页面超时

selenium 异常

selenium异常

selenium页面基本操作

selenium页面刷新

Selenium对象页面模型

Selenium 页面加载慢

selenium抓取动态页面

selenium与页面的交互

selenium页面跳转

SELENIUM处理页面下载

Selenium（Java）——页面滚动

selenium-页面操作

Selenium入门19 捕获异常

Selenium设置页面超时时间-快速终止页面加载

scrapy+selenium中关于同一个页面模拟点击后，打开新的标签页，切换到新页面的方法

selenium打开新的标签页

如何设置页面加载超时时间，robotframework+selenium实现

selenium超时设置

Selenium 等待与超时（一）

selenium -页面分离设计思路

Selenium IDE 页面功能介绍

selenium之定位页面元素

Selenium：动态页面模拟点击

selenium处理页面select元素

selenium切换页面

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)