spider 02爬虫requests库 - 代码天地

spider 02爬虫requests库

其他 2020-09-11 10:32:55 阅读次数: 0

import requests

1发送带header的请求

为什么请求需要带上header？
模拟浏览器，欺骗服务器，获取和浏览器一致的内容
header的形式：字典

headers={“User-Agent”:"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36
"}
用法：request.get(url,headers=headers)

2发送带参数的请求

例如：https://www.baidu.com/s?wd=python&c=b
参数的形式：字典
kw={“wd”:“长城”}
用法：request.get(url,params=kw)

url编码和其他的编码方式不太一样

task
1获取新浪首页，查看response.text和response.content.decode()的区别
2.实现任意贴吧的爬虫，保存网页到本地

猜你喜欢

转载自blog.csdn.net/qq_35264080/article/details/84663958

spider 02爬虫requests库

【spider02】requests

spider(Requests)

Spider 爬虫

爬虫Spider 03 - requests模块 | xpath解析 | lxml解析库

爬虫原理详解spider

Spider-爬虫介绍

【spider】爬虫分析

Web Spider - 爬虫

Java网络爬虫Spider

Spider爬虫个人练习

PHP Spider爬虫

爬虫 -Spider扩展介绍

spider数据挖掘-----3、requests库理解

Spider——requests模块（HTTP for Humans）

spider

JAVA 爬虫 WebCrawler Spider Bot

net spider（python 网络爬虫）

Spider爬虫框架之Selectors

爬虫框架Scrapy的组件spider

Spider 好用模块记录最新的爬虫工具requests-html

Spider Note2 requests模块

CrawlSpider（规则爬虫）和Spider版爬虫

Spider-聚焦爬虫与通用爬虫的区别

转网络爬虫（Spider）Java实现原理

网络爬虫（Spider）Java实现原理（转载）

python 爬虫(三) spider类详解

Spider爬虫框架之Spiders模块

Spider学习笔记（六）:爬虫部署

django+spider简易爬虫搭建

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)