Pythonの爬虫類基礎、17-パケットキャプチャツール

パケットキャプチャツールの01原則

HTTP

以来HTTPリクエストは暗号化され、また任意の検証を行うため、パケットキャプチャツールは、直接に要求を転送されていません。

HTTPS

HTTPS要求するので、クライアントは、データを暗号化するために、証明書サーバーを使用し、サーバは、実際のターゲット・サーバーであることを確認します。

 

 

だから、ときEtherealのパケットキャプチャツールのHTTPS要求は、変装されます。

クライアントサーバーとして偽装し、サーバーに要求を送信する際にクライアントとして偽装への独自の証明書との最初のパケットキャプチャツール。

クロールおよび転送データを達成するために。

フィドラー

公式サイトには、ダウンロードしてインストールするには:

https://www.telerik.com/fiddler

 

 

それは、最も包括的かつ強力なキャプチャツールはフィドラーで、使用するにはあまりにも面倒ではありません現時点で言うことができます。

 

 

フィドラー公式サイトも非常に詳細なドキュメントやチュートリアルを提供している、使用時に問題が発生した場合、文書の公式ウェブサイトに直接アクセスすることができます。

また、単に確認するために何かをするためにそこに言われて、直接HTTPでのパケットキャプチャツールのクロールHTTPSパケット転送時間が異なります。だから我々は、HTTPS用の証明書を設定する必要があります。

選択されたHTTPSを開いた後、このオプションをチェックして、以下の表示される2つのオプションをご確認ください。そして、最後のポップアップウィンドウは、[はい]を選択します。

 

02使用パケットキャプチャツール

ツールバー

1. :セッションのシリアル番号

2. 検索結果を:要求に応じてステータスコード

3. プロトコル:プロトコルタイプが要求されました

4. ホスト:ドメイン名

5. URLを:URLリクエスト

6. ボディ:応答のサイズ

7. キャッシュ:キャッシュモード

8. コンテンツタイプ-応答のデータ型:

9. プロセス:要求を開始するプロセス

10. コメント:コメント

1.セッションにコメントを追加

2. リプレイ:ターゲット・セッション再送

3.セッションを削除します

4.ブレークポイントのセッションが再開

5. デコード:読みやすい形式に送信データを復号化します

6. 検索:セッションを探します

7. 保存* *:**セッションのコストは、ファイルを保存します

8. キャッシュのクリア:キャッシュのクリア

セッションウィンドウ

1. :セッションのシリアル番号

2. 検索結果を:要求に応じてステータスコード

3. プロトコル:プロトコルタイプが要求されました

4. ホスト:ドメイン名

5. URLを:URLリクエスト

6. ボディ:応答のサイズ

7. キャッシュ:キャッシュモード

8. コンテンツタイプ-応答のデータ型:

9. プロセス:要求を開始するプロセス

10. コメント:コメント

同時に、各セッションは、異なる色を有する、異なる色が異なるセッション・タイプを表します。

Inspectors标签页

请求数据窗口

1.Headers:报头

2.TextView:查看文本数据

3.Syntax:根据语法格式查看

4.WebForms:Web表单

5.HexView:查看十六进制数据

6.Cookies:查看请求的Cookies

7.Json:查看json格式数据

响应数据窗口

1.Transformer:解压方式

2.Headers:报头

3.TextView:查看文本数据

4.Syntax:根据语法格式查看

5.ImageView:查看图片

6.WebForms:Web表单

7.HexView:查看十六进制数据

8.Cookies:查看响应设置的Cookies

9.Json:查看json格式数据

03 查找过滤**Session**

Filters选项卡

我们在抓包的时候常常会遇到非常杂乱的请求,而我们需要去分析的往往只是其中很小的一部分,那么我们就需要从许多请求中过滤出我们需要的那些请求。

1.是否使用Filters。

2.Filters的规则是可以保存和加载的,也就是我们可以把规则保存下来以后再用。

3.根据Host域名来进行筛选。

4.根据客户端的进程来进行筛选。

5.根据请求的Headers来进行筛选。

6.断点:Fiddler的断点功能能够让请求在发送后,或者是在返回时暂停,这时候就能够对请求和响应进行相应的修改。

7.根据响应的状态码筛选。

8.根据响应的类型和大小来进行筛选。

9.根据响应的Headers来进行筛选。

Find查找

使用快捷键ctrl+f或者在工具栏中选择find来打开查找窗口,查找窗口可以从所有session中搜索到我们想要的session

1.文本输入框。

2.可以选择搜索的范围,限定在仅Requests或者response中,也可以选择限定在headers或bodies中。

3.是否区分大小写。

4.是否用正则表达式来搜索。

5.仅仅搜索被选中的session。

6.将搜索到的结果高亮,可以选择颜色。

命令行查找

在Fiddler中同样也是可以使用命令行来进行搜索的,在图中的黑框中输入命令即可。

1.select命令:搜索相应类型的session,也就是content-type。

2.?命令:根据URL来进行搜索。

3.=命令:根据状态码来进行搜索。

4.@命令:仅根据域名进行搜索。

04 断点

设置断点是Fiddler最强大的功能之一,在设置好断点后,Fiddler会捕捉所有经过的消息,我们可以任意修改HTTP请求信息,包括Host、Cookies或表单的数据。可以设置断点修改request,也可以设置断点修改response。

断点方式有两种,一种是通过菜单栏设置全局的断点,一种是通过命令行设置指定的断点

全局断点

在菜单栏中选择Rules

Automatic Breakpoints,即可选择断点方式。有两个选择,分别是在请求往服务器发送的时候暂停,和在响应返回到客户端的时候暂停。

指定断点

指定断点需要输入指定的命令来进行断点:

1.bpu(breakpointurl):在指定网页发起请求后暂停。如:bpu www.baidu.com

2.bpafter(breakpointafter):在指定网页返回响应时暂停。

3.bpm(breakpointmethod):中断指定请求方式的请求。如:bpm get

4.bps(breakpointstatus):中断指定状态码的session。如:bps 200

おすすめ

転載: www.cnblogs.com/winfun/p/10985587.html