技術の内容仕上げMOOC--北京大学、中国大学セルフ - アルテミシア日-PythonのWebクローラや情報抽出
使用requests.get()メソッドクローリングウェブ画像およびローカルに保存すること
1 インポート要求 2 。3パス= " :/picture.jpg D " #は保存パスを設定する 。4 URL = " http://img.kitstown.com/news/2020/01/20psg4th.jpg " #のウェブイメージパスを 5。 R&LT = requests.get(URL) 6 プリント(r.status_code) 7を開く(パスと" WB " F AS): 8 f.write(r.content) 位であるファイル(、実際の画像に書かれたバイナリコンテンツを返します)ローカルにクロール
さらに、最適化コードのために、ローカルファイル名に格納されたファイル名は、オリジナルと同じであり、思い出させるために例外を追加すること
インポート要求 のインポートOS のurl = " http://img.kitstown.com/news/2020/01/20psg4th.jpg " ルート = " ://写真は// D " #ディレクトリのセーブセット パス=ルート+ url.splitを(「/ 」)[--1] #の元のファイルのローカル・ネーミングのために使用される名前の絵 試して: のiF ない os.path.exists(ルート): #は、現在のルートディレクトリが存在するかを決定 os.mkdir(ルート)の 場合は いないはos.path .exists(パス): #は、ファイルが存在するか否かを判断 R&LT = requests.get(URL) を開く(パスと、' Wbは' :F AS) f.write(r.content) f.close() 印刷(" ファイルが正常に保存" ) 他: 印刷(" ファイルが既に存在する" ) を除い: 印刷(" 失敗をクロール")