Pythonの爬虫類チュートリアル:「Pythonが表現パッケージをクロールして。」

Pythonの爬虫類チュートリアル:表現せずに、「Pythonは表現パッケージをクロールして」、マイクロチャネルパッケージ?心配しないでください!教師は〜マルチスレッドクロール爬虫類にキー式の20ワットパックを使用することができ導きました

Pythonの爬虫類チュートリアル:表現せずに、「Pythonは表現パッケージをクロールして」、マイクロチャネルパッケージ?心配しないでください!教師は〜マルチスレッドクロール爬虫類にキー式の20ワットパックを使用することができ導きました

Pythonの爬虫類チュートリアル:表現せずに、「Pythonは表現パッケージをクロールして」、マイクロチャネルパッケージ?心配しないでください!教師は〜マルチスレッドクロール爬虫類にキー式の20ワットパックを使用することができ導きました

Pythonの爬虫類チュートリアル:表現せずに、「Pythonは表現パッケージをクロールして」、マイクロチャネルパッケージ?心配しないでください!教師は〜マルチスレッドクロール爬虫類にキー式の20ワットパックを使用することができ導きました

プロジェクト出所:

1   
2  「'」
3を 、私はあなたが学習プロセスに追加することができますかわからない何
 4  、QunケリPythonの学習交流934 109 170
 5  グループを、良いチュートリアル、開発ツールと電子書籍があります。
6  共有のpython現在のビジネスニーズとあなたの才能とどのように良い、ゼロベースからの学習のpython、どのような内容を学びます。
。7  '' 
'8  から pyqueryのインポートPQ AS pyquery
 。9  インポート要求
 10  からのRedis インポートStrictRedis
 。11 O = 0
 12である =ヘッダ{
 13は     ' ユーザエージェント''Mozilla / 5.0(Windows NTの10.0; WOW64)のAppleWebKit / 537.36(ヤモリ様KHTML)クローム/ 58.0.3029.110サファリ/ 537.36 SE 2.X MetaSr 1.0 ' 
14   
15  }
 16   
17   
18  DEF XPAN(canshu):
 19      試み20          URL = ' https://www.doutula.com/photo/list/?page= ' + STR(canshu)
 21          、SP = requests.get(URL、ヘッダー= ヘッダ)の.text
 22   
23          DOC = PQ(SP)
 24          アイテム= DOC(' .COL-XS-6 IMG ' ).items()
 25   
26          のためにアイテム:
 27              のCu = i.attr(' データオリジナル' 28   
29   
30   
31は、             #1 R&LT(Cuは、「F:図の/%s.jpg'%uの/バケット)
32             。U + 1 = 
33である             #1 印刷( 'ダブル現在格納されている%のD' %U)
34は             #1 印刷(銅)
35              のRedis = StrictRedis(=ホスト' 172.18.200.5 '、ポート= 6379、DBの= 1、パスワード= '' 36              redis.sadd(' バケット図ウェブURLのダウンロード写真" 、Cu)で
 37 [   
38は     除くE AS例外:
 39   
40        印刷エラー、e.args)
 41 A = INT(INPUT(私はあなたがどのように多くのページもクロール必要に尋ねる:))
 42  印刷するには' 「リンクをクロール再とRedisのデータベースに保存します。お待ちください... ...... ' 43がある ために I レンジ(A):
 44である  
45     。XPAN(I + 1 46である  
47のRedis = StrictRedis(=ホスト' 172.18.200.5 'ポート= 6379、DBの= 1、パスワード= ' 「48 redis.sremは、(戦いのネットワーク図のダウンロードはのURLを描写していないなし" 49  のための I における redis.smembers(' 図ネット写真URLのバケツ' ):
 50      T = STR(I、エンコーディング= ' UTF8 ' 51は、     #1 印刷(T)
52である      R&LT t.split =(' / ' [) -1 ]
 53である      dizhi = ' F:/バケット図/ ' + R&LT
 54は      REQ = requests.get(T)
 55      を開くと(dizhi、' WB ' )P AS:
 56である         p.write(req.content)
 57が         印刷"%dが保存されて保存されているO)
 58          O + 1 =

 

おすすめ

転載: www.cnblogs.com/xiaoyiq/p/11444645.html