python 爬取网页的通用代码框架 - 代码天地

python 爬取网页的通用代码框架

其他 2018-12-09 18:38:49 阅读次数: 0

爬取网页的通用代码框架就是一组代码

它可以准确的可靠的爬取网页上的内容。

但是这样的语句不是一定成立的，因为网络连接有风险。

常见的异常有：

而raise_for_status方法可以返回所引发的httperror异常。

爬取网页的框架代码如下：

import requests
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()  #如果状态不是200 引发http error异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"


if __name__ == "__main__":
    url = "http://www.baidu.com"
    print(getHTMLText(url))

猜你喜欢

转载自blog.csdn.net/k_koris/article/details/82951880

python爬取网页的通用代码框架

python 爬取网页的通用代码框架

Python-爬取网页的通用代码框架

2.零基础系统学习Python爬虫之爬取网页的通用代码框架

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

python爬取网页基本框架

爬取网页的通用代码框架

python爬取网页

人生苦短之爬虫爬取网页的通用代码框架

爬虫爬取网页的通用代码框架（附实例）

2_爬取网页的通用代码框架

Python示例代码之爬取网页中的表格

python 爬取网页照片！全代码！指定数量，指定目录，爬取过程详细！

python动态爬取网页

Python 爬虫爬取网页

Python爬取网页图片

Python爬取网页title

python 爬取静态网页

python爬取网页（简易）

python爬取网页信息

【python】爬取网页图片

Python爬取网页内容

python爬取简单网页

python爬取网页视频

Python不仅能爬网页还能爬取APP呢！批量爬取抖音视频！最新代码

Python - Python 简单爬取网页内容

[源代码]Python爬取网页制作电子书代码发布

python爬取视频代码

Python3~Scrapy框架爬取网页数据到MySql~pipelines.py

不会Python爬虫？教你一个通用爬虫思路轻松爬取网页数据

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)