单页图片爬取--并保存到本地

其他 2018-09-04 15:51:13 阅读次数: 0

import requests,re,json,os
from urllib import request

创建文件夹

if not os.path.exists(‘ttss’):
os.mkdir(‘ttss’)

定义路由

url=’https://www.toutiao.com/a6581764599236788740/’

定义hear

headers={
‘User-agent’:’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36’
}
response=requests.get(url,headers=headers)
html_text=response.text

print(html_content)

with open(‘jinritoutiao.html’,’wb’) as ff:

ff.write(html_content)

partten=’gallery: JSON.parse((.*)),’
res_object=re.search(partten,html_text)
if res_object:
#这是匹配到的具体内容
res_str1=res_object.group(1)
#转化两次才能成为字符串
res2=json.loads(res_str1)
res_dict=json.loads(res2)
# #打印确认是字典
# print(type(res_dict))
print(res_dict)
#取出所需路由
res_url=res_dict[‘sub_images’]
print(res_url)
#遍历取出所有url
for image_url in res_url:
pic_url=image_url[‘url’]
# print(pic_url)
#给图片命名
image_name=’ttss/’+ pic_url.split(‘/’)[-1]+’.jpg’
#保存图片到文件夹jinritoutiao
request.urlretrieve(pic_url,image_name)
else:
print(‘图片下载失败了’)

猜你喜欢

转载自blog.csdn.net/chengjintao1121/article/details/81841716

单页图片爬取--并保存到本地

爬取图片并保存到本地

scrapy框架爬取图片保存到本地或mongodb的写法

python爬虫爬取图片并保存到本地

python爬取网站上的图片并保存到本地

将csdn的文章爬取，并将图片保存到本地

使用原生php爬取图片并保存到本地

python爬虫爬取图片保存到本地文件

Paython爬取网页所有图片并保存到本地

利用Jsoup爬取网站的图片，保存到本地

python爬取网页图片并保存到本地

爬取图片实例python爬虫（保存到本地）

Java 爬取网页并保存到本地

【Python】- scrapy 爬取图片保存到本地、且返回保存路径

爬取多态加载图片同时保存到本地指定文件夹

scrapy爬取校花网男神图片保存到本地

Python：scrapy框架爬取校花网男神图片保存到本地

scrapy爬虫系列之三--爬取图片保存到本地

node.js 爬虫实现爬取网页图片并保存到本地

爬取校花图片保存到本地文件夹下（requests+re）

爬取一个网页保存到本地文件

使用Python爬取性感美女并保存到本地

爬虫实践小例子爬取书籍保存到本地

爬虫爬取《全职法师》并保存到本地

python爬取网站视频保存到本地

爬取今日头条历史图集将信息保存到MongDB，并且下载图片到本地

Python爬虫：爬取某鱼颜值主播图片并保存到本地升级版！

下载图片并保存到本地

网络爬虫（爬取网站图片，自动保存本地）

使用Scrapy爬取图片入库,并保存在本地

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)