利用python编写一个简单的爬糗事百科热图爬虫 - 代码天地

利用python编写一个简单的爬糗事百科热图爬虫

其他 2020-01-19 13:27:02 阅读次数: 0

python爬虫，爬取糗事百科并保存到文件中

以下是代码实现部分，如果对你有帮助，留下一个赞

from urllib import request
from lxml import etree
from urllib import request
import time
def page():
    for num in range(1,6):
        time.sleep(1)
        base_url = 'https://www.qiushibaike.com/imgrank/page/{0}'.format(num)
        headers = {
            'User-Agent': ' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'}
        # 构造带有请求头的url
        req = request.Request(base_url, headers=headers)
        response = request.urlopen(req)
        html = response.read().decode('utf-8')
        htmls = etree.HTML(html)
        make_page(htmls)
# 清洗数据/存储
def make_page(htmls):
    from urllib import request
    picture = htmls.xpath('//div[@class="thumb"]/a/img/@src')
    time.sleep(1)
    for pic_url in picture:
        src = pic_url.split('/')[-1]
        image_url = 'https:' + pic_url
        print('图片下载中。。。。。')
        request.urlretrieve(image_url,'D:\66\ssss' )
        print('写入完成')
page()```

*
*

赵北北北北北

发布了22 篇原创文章 · 获赞 4 · 访问量 1980

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41337034/article/details/89366330

利用python编写一个简单的爬糗事百科热图爬虫

一个简单的爬虫代码爬取糗事百科段子（selenium+ChromeDriver）

python爬虫入门实战（一）---爬糗事百科

java 爬虫爬取糗事百科热图图片

python—多协程爬取糗事百科热图

python爬虫（二）爬取糗事百科

爬虫：python爬取糗事百科网页信息

python爬虫1、~爬取糗事百科

利用Python爬取糗事百科段子信息

Python爬虫实现爬取糗事百科段子 (26行代码简单实现)

Python爬取糗事百科

python爬去糗事百科

python 糗事百科爬虫

python爬虫-糗事百科段子

python糗事百科爬虫

python-爬虫-糗事百科

python3糗事爬取-------------------糗事百科

糗事百科爬虫

爬虫糗事百科

爬虫实战（二）：爬取糗事百科段子

爬虫多线程案例：爬取糗事百科

爬虫实战一基于Python3的urllib+re模块爬取糗事百科

python爬虫练习1：通过python爬取糗事百科的搞笑图片

芝麻HTTP:Python爬虫实战之爬取糗事百科段子

python爬虫十二：middlewares的使用，爬取糗事百科

Python爬虫实战(六)：爬取糗事百科段子

python爬虫学习之路(7) 爬取糗事百科

[Python爬虫]使用Scrapy框架爬取糗事百科

[爬虫]用python的requests模块爬取糗事百科段子

[Python 爬虫之路1] 爬取糗事百科（requests，bs4）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)