Python爬取腾讯漫画《一人之下》 - 代码天地

Python爬取腾讯漫画《一人之下》

其他 2020-02-15 15:34:31 阅读次数: 0

直接上代码吧

import requests
from lxml import etree
from selenium import webdriver
import time
import os
import re
import urllib.request

NUMBER=0
def getImg(browser,page=1):
    try:
        url = 'https://ac.qq.com/ComicView/index/id/531490/cid/{}'.format(page)
        browser.get(url)

        #判断
        isErr = isErrerView(browser,url)
        if(isErr==404):
            page+=1
            getImg(browser,page)
        else:
            page=int(isErr)
            #创建文件夹
            os.mkdir("E:/Temp/yrzx/第"+str(page)+"章")
        execDef(browser);
        re = browser.page_source
        html = etree.HTML(re)
        #获取所有a标签下的img节点
        result = html.xpath('//ul[@class="comic-contain"]/li/img/@src')
        print("第"+str(page)+"章一共有"+str(len(result))+"张图")
        downImg(page,result)
    except Exception as e:
        print("--抛出异常--")

def isErrerView(browser,url):
    browser.get(url)
    title = browser.title	#获取页面title
    st = "错误提示"
    iserrer = st in title
    #如果是错误页
    if(iserrer):
        return 404
    else:
        test = re.findall(r"\d+",title)
        return test[0]

def execDef(driver):
    n = 20
    for i in range(1, n + 1):
        time.sleep(0.5)
        js = 'var q=document.getElementById("mainView").scrollTop=' + str(i * 1500)
        driver.execute_script(js)

def downImg(page,list):
    global NUMBER
    j=1
    root = 'E:/Temp/yrzx/第'+str(page)+'章'
    for x in list:
        r = requests.get(x)
        with open(root+'/'+str(j)+'.jpg', 'wb') as f:
            f.write(r.content)
            f.close()
            print("文件保存成功=="+str(page)+"-"+str(j))
        j+=1
        NUMBER+=1
        print("累计下载-"+str(NUMBER))

def main():
    a, b = map(int, input("请输入章节范围:").split('-'))
    browser = webdriver.Chrome()
    for x in range(a,b):
        getImg(browser,x)
    browser.close()

if __name__=="__main__":
    main()

发布了21 篇原创文章 · 获赞 2 · 访问量 6492

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43386443/article/details/99325616

Python爬取腾讯漫画《一人之下》

【Python爬虫+js逆向】使用Python爬取腾讯漫画的逆向分析（典型签名验证反爬虫的解决方案）——以腾讯动漫《一人之下》第一话为例

一人之下（名言吧）

《一人之下》王也

一人之下漫画（百度网盘）

复刻手游《一人之下》的角色渲染

《一人之下》被家长盯上了，又一部优质动漫要陨落了？

一人之下第二季百度云高清下载

爬取腾讯漫画

【爬虫】使用Selenium爬取腾讯漫画

爬取异步请求（XHR/JS）数据方法一人工分析异步请求

python 爬虫爬取某网站的漫画

宅男福利，python爬取漫画

scrapy实践二（selenium爬取腾讯漫画【失败】）

python 爬取腾讯新闻

python爬虫爬取B站【马保国】诶..朋友们好啊，我是混元形意太极门掌门人——马保国，独自一人撑起了B站2020年的年尾。

python爬取所有人位置信息——腾讯位置大数据

Python爬取暴走漫画动态图

Python爬取漫画岛，宅男必备程序

基于Python实现的ComicReaper漫画自动爬取脚本

Python 初级运用 request 和 selenium 爬取漫画

根据示例代码学习爬取漫画（一）

python实现腾讯招聘爬取

python爬虫之爬取腾讯新闻

python爬取腾讯招聘的职位

Python爬取腾讯视频评论

python 爬虫 scrapy 爬取腾讯招聘

python爬虫实战——爬取腾讯新闻！

python 爬取腾讯视频评论

[Python]爬取腾讯视频弹幕

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)