数据爬取——requests库 - 代码天地

数据爬取——requests库

其他 2021-03-06 06:13:24 阅读次数: 0

学习路径
北京理工大学的国家精品课程（中国大学MOOC）

Python网络爬虫与信息提取

requests库的安装
win平台：以管理员身份运行”cmd“，执行
pip install requests

运行环境：Python 3.6.8（IDLE）

测试Requests库是否安装成功
在这里插入图片描述
status_code —— 状态码
乱码了，这个是因为编码格式不对造成的，但你的requests库安装成功了，恭喜你。

Requests库有7个主要方法
这些概念不太想记，自己也不是很懂

get（）方法
上面那段程序已经用过这个方法了，这个就是发送一个请求，得到一个响应。具体看图

顺便了解了一下url，就是万维网的地址标识（单指此处）
这个截个图，以后应该会用到

Requests库的2个重要对象

Request
Response（包含爬虫返回的内容）
Response对象的属性

乱码问题解决
理解Response的编码

理解Requests库的异常
（这个图表备自己以后翻阅记忆）
在这里插入图片描述

爬取网页的通用代码框架
网络连接有风险，异常处理很重要

#爬取网页的通用代码框架

import requests
import time

def getHTMLText(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

if __name__ == "__main__":
    url = "http://www.baidu.com"
    print(getHTMLText(url))

猜你喜欢

转载自blog.csdn.net/qq_41685741/article/details/114401229

数据爬取——requests库

Python爬取数据之Requests库!

数据分析——Requests库网络爬取实战

requests库爬取需要登录的网站

requests简单爬取网站数据

Requests爬取chinadaily海量新闻数据

requests模块爬取数据操作流程

requests+正则爬取猫眼电影并将数据存储到mysql数据库

猫眼电影爬取(二)：requests+beautifulsoup，并将数据存储到mysql数据库

猫眼电影爬取(三)：requests+pyquery，并将数据存储到mysql数据库

requests库+ajax数据分析+多线程爬取头条图集

requests库爬取豆瓣热门国产电视剧数据并保存到本地

Python之requests+xpath爬取猫眼电影并写入数据库(图文教程)

python的requests库构造的爬虫即不报错也不继续爬取数据的问题

python requests库爬取冒险岛发布站数据

python战反爬虫：爬取猫眼电影数据 (一）（Requests, BeautifulSoup, MySQLdb,re等库)

Python爬虫之Requests库爬取海量图片！数据都是钱啊

python爬虫爬取虎牙数据（简单利用requests库以及Beautifulsoup）

Python3.x使用requests库将爬取数据存储到MySQL

使用requests库爬取百度翻译

requests和re库爬取淘宝商品信息

python学习(23)requests库爬取猫眼电影

Python 利用Requests库爬取单个网页实例

使用requests 库爬取百度图片

Python-Requests库网络爬取实战

Python爬虫使用requests库爬取表情包

使用Requests+xpath实现简单的数据爬取

python requests爬取高德地图数据

python 使用selenium和requests爬取页面数据

python：Requests+正则爬取网页数据

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)