【教程】记录：python基础爬虫代码（下载妹子福利图片） - 代码天地

【教程】记录：python基础爬虫代码（下载妹子福利图片）

其他 2018-10-21 18:32:39 阅读次数: 0

废话不多说，直接代码复制进去自己观察。

前面import的，就是要安装

re

os

beautifulsoup

注意在本代码同级下创建一个mm文件夹准备放福利

至于网站，是大神给我的网站，我可是纯洁的好孩子。

感觉身体被掏空

import requests,re,os
from bs4 import BeautifulSoup

base_url='http://www.mmjpg.com/home/{page}'
def get_url(page):
	PicSet=set()
	for i in range(1,page+1,1):
		print("正在收集第"+ str(i) +"页数据.")
		url=base_url.format(page=i)
		resp=requests.get(url)
		resp.encoding='utf-8'
		href_pattern=re.compile(r'href="http://www.mmjpg.com/mm/(.*?)"')
		name_pattern=re.compile(r'alt="(.*?)"')
		bsObj=BeautifulSoup(resp.text,'lxml')
		PicUrlList=bsObj.find_all('li',{})
		for Pic in PicUrlList:
			String=str(Pic)
			page_url=re.findall(href_pattern,String)[0]
			name=re.findall(name_pattern,String)[0]
			print("正在收集"+ page_url +"数据")
			info=(page_url,name)
			PicSet.add(info)
	return PicSet
	
def download(picname,picurl):

	b_url='http://www.mmjpg.com/mm/'
	url=b_url+picurl 
	resp=requests.get(url)
	resp.encoding='utf-8'
	strFind ='class="content"(.*)/></a></div>'
	StrUrl=re.findall(strFind,resp.text)[0]
	url=re.findall('src="(.*)1.jpg"',StrUrl)[0]

	strFind ='class="page"(.*)</a><em '
	StrNum=re.findall(strFind,resp.text)[0]
	num=StrNum[-2:]
	num=int(num)
	
	for n in range(1,num+1,1):
		img_src=url+str(n)+".jpg"
		img = requests.get(img_src).content
		DirPath=os.getcwd()+"\\mm\\"
		path=DirPath+picname+str(n)+'.jpg'
		print('正在下载: '+str(n)+'...')
		with open(path,'wb') as f:
			f.write(img)
			
page=5
PicPool=get_url(page)
print("收集数据完毕，准备下载-----------")
sum=1
try:
	for Pic in PicPool:
		picurl=Pic[0]
		picname=Pic[1]
		print("正在操作第"+ str(sum) +"板块数据=========")
		download(picname,picurl)
		sum=sum+1
finally:
	print('下载停止')

猜你喜欢

转载自blog.csdn.net/EddyLwei/article/details/73346842

【教程】记录：python基础爬虫代码（下载妹子福利图片）

爬虫下载妹子图片

记录一次python爬虫批量下载一个校花网站的妹子图片

Python爬虫福利第二弹---爬取妹子图最新图片

福利爬虫妹子图

Python爬虫之妹子图片

爬虫福利之妹子图网MM批量下载

爬虫福利二之妹子图网MM批量下载

python爬虫妹子图片网

Python爬虫之——爬取妹子图片

python爬虫篇1：爬妹子图片

Python爬虫教程：爬取妹子图

爬虫福利三之妹子图网MM下载多任务版

【python--爬虫】妹子图街拍美女爬虫(绅士福利你懂的)

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

用python爬荣耀皮肤图片（爬虫最基础题，python爬虫教程，超详细+完整代码）

python爬虫学习（十三）xpath爬取妹子图片

python爬虫学习（七）爬取单张妹子图片

python爬虫.4.下载煎蛋网妹子图

Python爬虫入门教程：爬取妹子图网站

python-使用协程下载妹子图片

python爬虫煎蛋网妹子图2（代码）

Python 爬虫（清纯）妹子图爬取（代码自由奔放）

福利！！！Python爬取好看的妹子图！！！

【福利篇】python爬取妹子图

Python福利——爬取妹子图

python实现顺序结构基本爬虫，爬取福利图片

python爬虫图片下载

Python爬虫requests 下载图片

python 爬虫批量下载图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)