简单入门爬斗鱼颜值区妹子照片 v1.1 - 代码天地

简单入门爬斗鱼颜值区妹子照片 v1.1

其他 2018-09-02 22:11:15 阅读次数: 0

版权声明：请多指教。 https://blog.csdn.net/qq_42776455/article/details/81300840

这是个比较简单的入门爬虫。基于python3。

urllib,urllib2,python3中用urllib.request代替，使用方法基本一致。

 1 #python3
 2 import urllib.request
 3 import time
 4 import re
 5 import random
 6 def getHtml(url):
　　　　 #添加User_agent，头信息，伪装成浏览器请求。
 7     headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
 8     req = urllib.request.Request(url=url, headers=headers)
 9     page = urllib.request.urlopen(req)
10     html = page.read()
11     return html
12 
13 def getImage(html):
14     html = html.decode('utf-8')
15     imageList = re.findall(r'src="(.*?\.(jpg|png))"',html)
16     x = 1
17     for imageUrl in imageList:
18         urllib.request.urlretrieve(imageUrl[0],'/home/hang/pythonLearning/Crawler/CrawlDouyuGirl/%d.%s'%(x,imageUrl[1]))
19         print("已下载：%s" % imageUrl[0])
20         x += 1
21         temp = random.randint(3,7)
22         time.sleep(temp)
23 
24 html = getHtml("https://www.douyu.com/directory/game/yz")
25 
26 getImage(html)

猜你喜欢

转载自blog.csdn.net/qq_42776455/article/details/81300840

简单入门爬斗鱼颜值区妹子照片 v1.1

简单小学两位数四则运算 (V1.1)

C#简易商城收银系统v1.1简单工厂实现(2-2)

Auto Stop v1.1

Grbl v1.1 Commands

Hyperledger Fabric v1.1 环境搭建

KiKaFramework V1.1发布

Twitter V1.1在Android中的应用

Phoenix V1.1 分析与测试

用户管理系统V1.1

configdebug版本升级v1.1

常用的linux命令总结V1.1

JavaWeb库存管理系统V1.1

拼图游戏 v1.1

发票统计者 V1.1

Grbl v1.1 控制命令（一）

sleuth v1.1 已经发布

jmeter_extra_tool v1.1

项目练习-推箱子V1.1

ControlNet v1.1：简短指南

Redis集群的搭建和使用V1.1

PBMS-个人图书管理系统_V1.1

QuestionAnsweringSystem v1.1 发布，人机问答系统

HYPERLEDGER FABRIC V1.1 笔记-概念原理

新人程序员学习计划V1.1

Chrome 扩展程序最近历史 HistoryBar v1.1

ofcms v1.1版本 API 使用实例

fabric v1.1 自动化部署脚本

喜马拉雅音频下载V1.1的功能

喜马拉雅音频下载V1.1

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)