クロールウェブ画像 - Pythonの爬虫類入門

 

技術の内容仕上げMOOC--北京大学、中国大学セルフ - アルテミシア日-PythonのWebクローラや情報抽出

 

使用requests.get()メソッドクローリングウェブ画像およびローカルに保存すること

1  インポート要求
 2  
。3パス= " :/picture.jpg D "   #は保存パスを設定する
。4 URL = " http://img.kitstown.com/news/2020/01/20psg4th.jpg "   #のウェブイメージパスを
5。 R&LT = requests.get(URL)
 6  プリント(r.status_code)
 7を開く(パスと" WB " F AS):
 8      f.write(r.content)   であるファイル(、実際の画像に書かれたバイナリコンテンツを返します)ローカルにクロール

さらに、最適化コードのために、ローカルファイル名に格納されたファイル名は、オリジナルと同じであり、思い出させるために例外を追加すること

インポート要求
  のインポートOS 
 のurl = " http://img.kitstown.com/news/2020/01/20psg4th.jpg " 
 ルート = " ://写真は// D "   ディレクトリのセーブセット 
 パス=ルート+ url.splitを(/ )[--1]  元のファイルのローカル・ネーミングのために使用される名前の絵
 試してのiF  ない os.path.exists(ルート):  は、現在のルートディレクトリが存在するかを決定
         os.mkdir(ルート)の
      場合は いないはos.path .exists(パス):  は、ファイルが存在するか否かを判断 
         R&LT = requests.get(URL)
         を開く(パスと、' Wbは' :F AS)
             f.write(r.content)
             f.close()
             印刷" ファイルが正常に保存" 印刷" ファイルが既に存在する" を除い印刷" 失敗をクロール"

 

おすすめ

転載: www.cnblogs.com/fcbyoung/p/12291235.html