爬取煎蛋网妹子图 - 代码天地

爬取煎蛋网妹子图

其他 2018-05-17 20:08:50 阅读次数: 2

煎蛋网妹子图网址：'http://jandan.net/ooxx/'

版本：python 3.x

import urllib.request
import os
import random 

def url_open(url):
	req = urllib.request.Request(url)
	req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:56.0) Gecko/20100101 Firefox/56.0')
	
	#proxies = ['119.109.194.57:80','61.135.217.7:80']
	#proxy = random.choice(proxies)
	
#	proxy_support = urllib.request.ProxyHandler({'http':proxy})
#	opener = urllib.request.build_opener(proxy_support)
#	urllib.request.install_opener(opener)
	
	
	response = urllib.request.urlopen(url)
	html = response.read()
	
	return html
	
#ҳ��
def get_page(url):
	html = url_open(url).decode('UTF-8')
 
	a = html.find('#comments">')+33
	b = html.find('                </a>',a)
	
	return html[a:b]

#ͼƬ��ַ
def find_imgs(url):
	html = url_open(url).decode('UTF-8')
	img_addrs = []
	a = html.find('img src=')
	while a!=-1:
		b = html.find('.jpg',a,a+255)
		if b != -1:
			#print('http:'+html[a+9,b+4])
			img_addrs.append('http:'+html[a+9:b+4])
		else:
			b = a+9
		a = html.find('img src=',b)

			
	return img_addrs
	
#����ͼƬ
def save_imgs(folder,img_addrs):
	for each in img_addrs:
		filename = each.split('/')[-1]
		with open(filename,'wb+') as f:
			img = url_open(each)
			f.write(img)

def download_mm(folder = 'OOXX',pages = 100):
	os.mkdir(folder)
	os.chdir(folder)
	
	url = 'http://jandan.net/ooxx/'
	page_num = int(get_page(url))
	
	for i in range(pages):
		page_num -= i
		page_url = url + 'page-' + str(page_num) + '#comments'
		img_addrs = find_imgs(page_url)
		save_imgs(folder,img_addrs)
		
if __name__=='__main__':
	download_mm()

猜你喜欢

转载自blog.csdn.net/weixin_37267014/article/details/78393729

爬取煎蛋网妹子图

煎蛋网妹子图爬取

python 爬虫爬取煎蛋网妹子图

python爬取煎蛋网妹子图，已解密图片~~~~~

python3通过selenium对煎蛋网妹子图的简单爬取

爬虫之煎蛋网妹子图大爬哦

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

Python Scrapy 煎蛋网妹子图实例

python爬虫.4.下载煎蛋网妹子图

python爬虫煎蛋网妹子图动态爬虫1

python爬虫煎蛋网妹子图2（代码）

用Selenium+PhantomJS来抓取煎蛋网妹子图

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

python3爬虫爬取煎蛋网妹纸图片

爬取煎蛋XXOO妹子网

Python教程：老师傅带你爬取全网妹子图！

Python爬取煎蛋网的妹子图，并保存到数据库

简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

Python3 破解煎蛋网妹子图的加密函数，获取图片

Python的学习笔记DAY8---爬虫练习之煎蛋网妹子图爬虫

爬取妹子图

python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效

python3 爬煎蛋ooxx妹子图

爬取煎蛋随手拍图

pyspider煎蛋无聊图爬取

python爬取妹子图

简单爬取妹子图

妹子图图片爬取

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)