python3シンプルな爬虫類のクロールウェブ画像

今すぐオンラインpython2書き込み爬虫類の多くの例は、ページの写真をクロールではなく、初心者に(初心者用のpython3環境、互換性のないpython2)がある
ので、私がすることを望んで、文法のpython3の絵でページを取得する簡単な例を書きましたすべての人に役立つ、と私はあなたの批判を願っています。
インポートurllib.request
 インポートインポートOS
 のインポートurllibはの
 #をhtmlページのソースコードを取得するURL与えられた内容に応じてWebページを取得するために   
DEF :getHtml(URL)
    ページ = urllib.request.urlopen(URL)を
    HTML = ページ。読んで()
     の戻り html.decode(' UTF-8。' 

DEF GETIMG(HTML):
    REG = R&LT ' SRC = "(。?。+ \ JPG)" pic_ext ' 
    imgre =re.compile(REG)
    imglist = imgre.findall(HTML) は、濾過全体のページアドレスimglistに配置され、すべての画像を表し 
    、X = 0 
    のパス = ' :\\テストD '   
   #は、Dへの画像を保存します。 \\テストフォルダ、全くテストフォルダが存在しない場合に作成される
    IF  ないos.path.isdir(パス):   
        os.makdirs(パス)   
    パス =パス+ \\       テストパスに保存   

    するための imgUrl imglist:   
        urllibは.request.urlretrieve(imgUrl、' {{0}}。1 .JPG ' .format(パス、X))  、画像URL imglist保存とローカルに保存されたイメージをダウンロード形式フォーマットされた文字列を開き
        。1 + X = X   返すimglist 
のhtml = getHtml(" http://tieba.baidu.com/p/2460150866 "#は、詳細については、ページのURLを取得し、取得されたHTMLページのソース   を印刷(GETIMG(HTML))分析し、ソースコードをダウンロードするには、Webページから画像を保存
    

 

おすすめ

転載: www.cnblogs.com/roboot/p/11410323.html
おすすめ