爬虫-----------简介 - 代码天地

爬虫-----------简介

其他 2019-03-31 11:11:08 阅读次数: 0

1.分类

通用爬虫（General Purpose Web Crawler）

聚焦爬虫（Focused Web Crawler）

增量爬虫（Incremental Web Crawler）

深度爬虫（Deep Web Crawler）

2.爬虫分类：网页抓取，数据提取，数据存储

3.HTTP 协议：超文本传输协议

HTTP为明文传输

HTTPS是在HTTP下添加SSL层，通过SSL安全传输协议进行加密的，在传输层对网络连接进行加密

HTTP的端口号为80

HTTPS的端口号为443

4.Requests

特性：支持TTP链接保持和连接池，

支持使用cookie保持回话，

支持文件上传，

支持自动确定相应内容的编码，

支持国际化的URL和POST数据自动编码

5.get与post的区别

6.常见的反爬措施

一、检测User-Agent

二、检测非人行为，封禁IP地址

三、登陆限制

7、绕过反扒的策略

一、伪造User-Agent

  # 写入User-Agent信息，指定请求头
    head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'
    # data携带表单数据
    response=requests.post(Request_URL,data=Form_Data,headers=head)

二、a、设置随机的延迟时间

b、设置代理IP

三、模拟登陆

a、使用登录之后的cookie信息模拟登陆

b、模拟提交表单实现登录

8.cookies和sission

cookies 在客户端，保存的较少，能保存登录之后的信息

sission 保存在服务端，占用服务器内存，保存一些重要的信息

猜你喜欢

转载自blog.csdn.net/weixin_44455142/article/details/88789653

爬虫简介

爬虫（简介）

爬虫-----------简介

爬虫学习----爬虫简介

爬虫(一)：爬虫简介

网络爬虫简介！网络爬虫简介！

python爬虫整理——爬虫简介

爬虫与反爬虫技术简介

scrapy 爬虫框架简介

python爬虫(一)简介

网络爬虫简介

python爬虫简介

python爬虫1 简介

网络爬虫的简介

Webmagic爬虫案例简介

爬虫简介与request模块

爬虫介绍及Scrapy简介

Python网络爬虫——简介

爬虫简介与基本语法

Scrapy网络爬虫简介

1 爬虫的简介

一.爬虫简介

1.1 网络爬虫简介

1.爬虫简介

爬虫基础简介

python爬虫--requests简介

一、爬虫基础简介

python爬虫入门简介

python - 爬虫简介

一：爬虫简介

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)