ランダムなサードパーティ製のスイッチのuser_agentのPythonライブラリ:my_fake_useragent

my_fake_useragent第三者ので、あなたはそれを自分でインストールする必要があります。

ちょうどライン上でそれを自分でインストールし、それが任意の追加や環境に依存しない、心配しないでください。

方法1:

伝統的なインストールをpycharm。

方法2:

インストールPIP ...

fake_useragentとmy_fake_useragentは実際のものです。

使用:ちょうど呼び出すための最も簡単な方法のうちの2つを言及します。

# - * -コーディング:UTF-8は- * - 

インポートUAをmy_fake_useragent AS

IF __name__ == '__main__':
user_agentのua.UserAgent =()

#1
#は、ランダムユーザーエージェントを取得し、取得した毎回同じではない
ため_範囲(10):
印刷(user_agent.random())

方法2
#1 user_agent.get_useragent_list():ユーザーエージェントのリストを返す
インデックスに、列挙にeach_useragent(user_agent.get_useragent_list()):
印刷(インデックス':'、each_useragent)

今のuser_agentが来る、私は少し話したと思います。

一見ユーザエージェントは、ちょうどそれが厄介な文字列の文字列である、またはコンテンツの多くは、実際にで構成されていて感じるとき。中国は(爬虫類プロキシIPとは別の使用)ユーザエージェントと呼ばれ、UAと呼ばれる、特別な文字列の先頭で、使用されるクライアントオペレーティングシステムとバージョンを識別するために、サーバーを有効にし、CPUの種類、ブラウザやバージョン、ブラウザのレンダリングエンジン、ブラウザの言語。

一部のWebサイトは、多くの場合、別のブラウザでUAによって異なるオペレーティングシステムに異なるページを送信してきます。

UAの標準書式指定文字列:

ブラウザ識別(オペレーティングシステムアイデンティティ、暗号化識別子のレベル、ブラウザ言語)レンダリングエンジンは、バージョン情報を特定します

ここでは文字列情報UAに含まれています

オペレーティング・システムID 
FreeBSDの
X11、FreeBSDのi386の(バージョンNO。)
X11; FreeBSDの(バージョンNO。)AMD64 
Linuxの
X11; LinuxのPPC 
X11; LinuxのPPC64 
X11; Linuxのi686の
X11; Linuxのx86_64で
マック
マッキントッシュ; PPCのMac OS X- 
マッキントッシュ、インテルマックOS X- 
Solarisの
X11; i86pcこのSunOSの
X11、SunOSののsun4u 
のWindows:
WindowsのNTのWindows 10オペレーティングシステムに10.0対応
のオペレーティングシステムのWindows 8へのWindows NT 6.2対応
のWindows NT、Windows 7オペレーティングシステムに6.1対応
オペレーティングシステムのWindows VistaへのWindows NT 6.0対応
のWindows NTで動作する5.2対応2003システムのWindows 
のWindows NT 5.1オペレーティングシステムはXPのWindows対応
のWindows 2000に対応するWindows NT 5.0オペレーティングシステム
のWindows ME 
Windows 98の
暗号化レベルの識別を N:何のセキュリティ暗号化を意味していない 私は:弱いセキュリティ暗号化表し U:強力なセキュリティの暗号化
ブラウザの言語 設定で>言語で指定された一般>言語
レンダリングエンジン プレストは、レンダリングエンジンブラウザ用に、形式は次のとおりです。プレスト/バージョン
バージョン情報 ブラウザは、フォーマットの実際のバージョン情報を表示します。バージョン/バージョン番号

この情報は、基本情報に対応するが、見つけることができ、コントロールにちょうどPythonコード出力に使用します。彼は実際に、と言ったのpython爬虫類のインタビューポイント処理が求められることがありますが、しかし、知識の人気のポイントですが、あまりにも、よく見ます。

おすすめ

転載: www.cnblogs.com/zrmw/p/11433200.html