爬取酷漫网漫画 - 代码天地

爬取酷漫网漫画

其他 2019-06-11 11:05:00 阅读次数: 0

# -*- coding: utf-8 -*-
# @Time    : 2019/6/11 9:47
# @Author  : wujf
# @Email   : [email protected]
# @File    : 斗罗大陆2.py
# @Software: PyCharm


import re
import requests
import urllib.request
from bs4 import BeautifulSoup

urls = ['http://www.kuman.com/mh-1003692/{}/'.format(str(i)) for i in range(1,22)]
for url in urls:

    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
    r =requests.get(url,headers =headers,timeout= 5)
    # r.raise_for_status()

    r.encoding = r.apparent_encoding    #直接加密
    content = r.text

    beaobj = BeautifulSoup(content.replace(' ', ' '),'html5lib')
    lis = beaobj.findAll('li',style="margin-top: -3.6px")
    for li in lis:
        image = re.findall(r'src="(.*?)"',str(li))  ################得到的无法判定对象数据类型，所以一定要加 str 否则报错
        name = image[0].split('/')[-1]
        image_name = 'E:\\Python\\python_image\\%s'%name
        try:
            s= urllib.request.urlretrieve(image[0],image_name)
            print("正在下载%s"%(image[0]))
        except Exception as e:
            print(e)

　　后面付费怎么爬取稍后更新

猜你喜欢

转载自www.cnblogs.com/wujf-myblog/p/11002313.html

爬取酷漫网漫画

简单爬虫爬取知音漫客VIP漫画【斗破苍穹、斗罗大陆】

爬取腾讯漫画

爬取酷狗音乐

爬取优酷弹幕

简单的小爬虫-漫画爬取

【爬虫】使用Selenium爬取腾讯漫画

python 爬虫爬取某网站的漫画

web爬虫爬取漫画源代码

一百行代码爬取漫画喵

scrapy爬取海贼王漫画

爬取漫画DB上的《浪客行》

用C#爬取漫画

宅男福利，python爬取漫画

爬取校花网

校花网爬取

深网爬取

爬取桌面网

知网爬取

python爬取酷狗排行音乐

爬取酷狗飙升榜

爬取酷狗酷狗飙升榜，爬虫案例

Scrapy爬取人人网

python爬取知网

python爬取拉钩网

爬取拉钩网信息

拉钩网————爬取尝试

拉勾网数据爬取

爬取全书网小说

花瓣网图片爬取

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)