referer与user agent的应用 - 代码天地

referer与user agent的应用

编程语言 2018-05-13 20:36:20 阅读次数: 0

最近写了个简单的程序，从搜索引擎搜索的数据中爬取内容。

以百度为例，可以用url http://www.baidu.com/s?wd=搜索关键字&pn=页数建立连接，直接获取到返回的信息。。

在访问其它几个搜索引擎（bing，有道等），发现直接使用url建立连接会返回403拒绝。但用浏览器请求却可以访问。。于是猜测是服务器端对user-agent进行了检查。。增加了伪装user-agent后，果然可以成功获取到了

connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows 2000)");

但在用于google的时候，发现获取不到google的搜索内容。用httpWatch观察了请求。发现google并不是直接response中返回结果的。。而是先返回response，则使用js进行获取搜索结果内容。。根据这个顺序猜测可能是referer做过限制。于是增加伪装referer，可以成功获取结果了

method.setRequestHeader("referer ",http://www.google.com");

经过上面的使用，在平时网站开发中，可以是用user-agent和referer进行处理

1、使用user-agent进行识别是否是用户操作，防止机器重复操作。当然还需要增加一些统计、频率的判断，否则很容易进行模拟

2、使用referer进行防盗链处理

猜你喜欢

转载自wobfei.iteye.com/blog/1141507

referer与user agent的应用

Linux下curl命令伪装http_referer和user-agent访问

iOS - User Agent 的应用和设置

请求头（Accept，Accept-Language，Accept-Encoding， Host，Cookie，Referer，User-Agent，Content-Type）

Web安全攻防的学习——07—(MySQL注入读写文件、HTTP头中的SQL注入、HTTP User-Agent注入、HTTP Referer注入、cookie注入)(重点)

JavaWeb~http请求常见方法/报头header字段Host、User-Agent、Cookie、Referer、Content-type/Http响应解析及状态码

HTTPHEAD中referer应用

网站中对referer的应用

user-agent

修改 chrome user agent

对User Agent的检测与模拟

限制user_agent

设置User Agent

爬虫 User-Agent

常见的User Agent

关于 user agent ua

User Agent与代理IP

User-Agent 汇总

获取User-Agent

User_Agent大全

User Agent 库：.md

user agent漫谈

User-Agent详解

change safari user agent

User-Agent 合集

常用的User-Agent

RootMe--User-agent

User-Agent大全

yandex bot user agent

基于HTTP请求头字段 User-Agent用户环境开发多端应用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)