シンプルクロールBaiduのポストバーの写真

輸入urllib.request
 インポートurllibは
 から lxmlのインポート  etreeの
 インポート要求
URL = " https://tieba.baidu.com/f?kw=%E6%A1%8C%E9%9D%A2&ie=utf-8&pn=50 " 
ヘッダ = { ' ユーザーエージェント'' のMozilla / 5.0(WindowsのNT 6.1)のAppleWebKit / 537.36(KHTML、ヤモリ等)クローム/ 63.0.3239.132サファリ/ 537.36 ' } 


応答 = requests.get(URL、ヘッダ)
HTML = etree.HTML (response.text)

IMG = html.xpath('* // [@クラス= "threadlist_media j_threadlist_media clearfix"] /リー/ A / IMG " 

X = 1。
 のための I におけるレンジ(LEN(IMG)): のimgのXPathとは、辞書がのリストを返し含まれてい 
           たデータを= IMG [I]は.attribの#1 に戻り、HREFタグとクラスラベル、テキスト返されるテキストは、タグは、タグ名を返すこと 
           J = DATA [ データオリジナル ] 辞書所望の出力リンクに応じて得られる 
           X = X +を1 
           urllib.request.urlretrieveを(J、C:\\ \\レノボユーザー\\デスクトップ\\%のs.jpg %X-) ローカルにファイルをダウンロードし、プラス接尾ショー形式
   

 

おすすめ

転載: www.cnblogs.com/persistence-ok/p/11440495.html