拦截和跟踪HTTP请求的主要方法及实现

一、HTTP 请求的拦截技术可以广泛地应用在反向代理、拦截 Ajax 通信、网页的在线翻译、网站改版重构等方面。而拦截根据位置可以分为服务器端和客户端两大类，客户端拦截借助 JavaScript 脚本技术可以方便地和浏览器的解释器及用户的操作进行交互，能够实现一些服务器端拦截不容易实现的功能。本文将重点介绍通过 JavaScript 脚本在客户端对页面内容进行拦截修改的一些原理和技术

二、方法简介

名称	特点	优点	缺点
利用浏览器的 Event	通过对 [ 鼠标事件 ]，[ 键盘事件 ]，[HTML 事件 ]，[Mutation 事件 ] 的监听，可以对用户的交互，页面的变化，特别是标签节点的变化做出响应	浏览器自身支持，代码量小，几乎可以用来控制所有的 HTML 内容	此方法中的 Mutation Event，Firefox2.0 平台已支持，IE6.0 尚未支持
通过 AOP 技术拦截	可以拦截大部分对象的方法调用。	很多 JS 代码库和框架已经支持 AOP 技术，代码简单	ActiveX 对象无法有效拦截。无法拦截普通的函数。另外单独使用此项技术会造成插入点复杂。
覆盖函数进行拦截	通过编写同名方法覆盖系统定义，用户自定义的函数 ( 构造函数 )，达到拦截目的，对普通函数的拦截是对 AOP 的补充。	不依赖其他的代码库和 JS 框架，对系统函数的覆盖有很好的效果，可以拦截构造函数用来控制对象的生成。	拦截自定义函数会造成插入点复杂
通过动态代理进行拦截	主要用来解决 ActiveX 对象的拦截问题，通过构造 ActiveX 对象的代理对象，实现拦截和跟踪。	典型的例子如 IE 平台下 AJAX 通信的拦截	代码复杂，属性更新的同步机制可能导致某些应用异常。
通过自代理和 HTML 解析进行拦截	此方法主要解决的是拦截时机的问题，配合上面的方法，就可以实现很多功能，而不必要等待页面的 onload 事件。	实现浏览器端页面加载前拦截的好方法	代码复杂

三、方法的实现

1、覆盖系统类 / 方法进行拦截

覆盖已定义的函数是在原函数定义后，调用前通过定义同名函数，达到拦截和跟踪的目的。其一般形式多如下面 :

var oriFunction = someFunction;

someFunction = function () {

return oriFunction(); //or oriFunction.call(x,);

}

第一步是（第一行代码）为了将指向原来函数的指针保存，以便后续使用。

第二步便是定义同名函数，在同名函数里面的适当位置调用原来的功能。这种方法不但可以跟踪原来函数，还可以修改和过滤函数的参数，甚至可以修改返回值。当需要操纵参数的时候，只需在新定义的函数中访问 arguments 对象即可。

例如：针对系统函数 window.open(URL,name,specs,replace) 我们可以通过下面的代码进行拦截：

var oriWindowOpen = window.open;

window.open = function(url,names,specs,replace) {

url = "http://www.ibm.com"; //or arguments[0]="http://www.ibm.com";

return oriWindowOpen(url,names,specs,replace);

}

上面的拦截会导致所有的 window.open 调用全部打开 http://www.ibm.com 窗口。

函数覆盖的适用范围较广，不但可以模拟 AOP 的实现，还可以对非对象函数进行操作。函数覆盖可以根据使用的差异分成若干情况 :

覆盖系统定义的函数、对象的方法：覆盖系统定义的函数或方法可以不用顾及代码插入点的问题，大可以将函数覆盖的代码放置在页面的最前边，并参照上面的形式进行操作。但是特别注意在 IE 平台下对 ActiveX 的对象的方法无效。
覆盖用户自定义的函数、对象的方法：覆盖用户自定义的函数，对象的方法需要考虑代码插入点的问题。正确的代码插入点的位置应该是在原函数定义之后，调用之前。
覆盖构造函数：覆盖构造函数是满足上面两种情况的一种特殊使用形式，跟踪对象创建之除，可以有效地针对对象的需要作出各种特殊的设置。

覆盖构造函数的一般形式 :

var oriFunction = someFunction;

someFunction = function () {

temp = oriFunction(); //oriFunction.call(x,);

return temp;

}

2、通过动态代理进行拦截

当在 IE6.0 平台遭遇 ActiveX 对象的时候，面对直接的函数覆盖不能奏效的时候，我们可以考虑通过另外一种办法，即动态代理 ActiveX 对象的方式实现拦截和跟踪。

首先我们通过覆盖构造函数的方法，将创建 XMLHttpRequest 对象的过程进行改造。

var oriActiveXObject = ActiveXObject;

ActiveXObject = function(param) {

var obj = new oriActiveXObject(param);

if(param == "Microsoft.XMLHTTP" ||

param=="Msxml2.XMLHTTP" ||

param == "Msxml2.XMLHTTP.4.0") {

return createActiveXAgent(obj);

}

return obj;

};

我们将构造过程拦截下来后，进行自己的改造，主要操作是创建对象，对象中设置与 ActiveX 对象相同的属性和方法，并且还需要同步属性方法。

function createActiveXAgent(ao) {

var agent = newObject;

agent.activeXObject = ao; //被包裹的内核，是真正的通信对象

agent.syncAttribute = function() { //syncAttribute是用来同步属性的

try{

this.readyState = this.activeXObject.readystate;

this.responseText = this.activeXObject.responseText;

this.responseXML = this.activeXObject.responseXML;

this.status = this.activeXObject.status;

this.statusText = this.activeXObject.statusText;

}catch(e) { }

};

agent.trigStateChange = function() { //模拟onreadystatechange

agent.syncAttribute();

if(agent.onreadystatechange != null) {

agent.onreadystatechange();

}

};

agent.activeXObject.onreadystatechange = agent.trigStateChange;

agent.abort = function() { //模拟abort

this.activeXObject.abort();

this.syncAttribute();

};

agent.getAllResponseHeaders =function() { //模拟内核对应的方法

var result = this.activeXObject.getAllResponseHeaders();

this.syncAttribute();

return result;

};

agent.getResponseHeader = function(headerLabel) { //模拟内核对应的方法

var result = this.activeXObject.getResponseHeader(headerLabel);

this.syncAttribute();

return result;

};

agent.open = function(method,url,asyncFlag,userName,password) {

//codetotraceandintercept;

url=getParamURL(url,method);

this.activeXObject.open(method,url,asyncFlag,userName,password);

this.syncAttribute();

};

agent.send = function(content) { //模拟内核对应的方法

this.activeXObject.send(content);

this.syncAttribute();

};

agent.setRequestHeader = function (label,value) { //模拟内核对应的方法

this.activeXObject.setRequestHeader(label,value);

this.syncAttribute();

};

return agent;

};

从上面的代码可以看出来，代理对象通过自身的方法模拟了原来 ActiveX 对象的方法。而更关键的属性问题，是通过在函数调用前后的属性同步函数实现的。即：在调用代理内核方法之前，将属性从代理对象同步给内核对象；在内核方法调用之后，将属性从内核对象同步给代理对象。

因为 AJAX 对象的属性几乎不被用户写入，故上面的实现只需要单向属性同步，即将内核属性同步给代理属性。对于复杂的应用，可以通过双向属性同步函数来解决属性的代理问题。

这种动态代理的方法将 ActiveX 对象像果核一样包裹起来，通过代理对象自身的同名属性和方法提供给外界进行访问，从而达到跟踪和拦截的目的。

拦截和跟踪HTTP请求的主要方法及实现

猜你喜欢