Python3爬虫入门第一课 - 代码天地

Python3爬虫入门第一课

其他 2018-11-09 13:22:55 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_36092584/article/details/81192078

在印象中Python就是用来抓数据的，这次用的Python3.7，发现和以前的2.x的版本语法差别还是很大的，因为没有进行版本兼容。

# coding:utf-8
import urllib.request 
import re

def get_html(url):
	page = urllib.request.urlopen(url)
	html = page.read() #注意read和write方法都是获取到字节码的
	return html
	
def get_image(htmlcode):
	reg = r'src="(.+?\.jpg)" width' #正则表达式 惰性匹配是从左侧第一个字符开始向右匹配
	reg_img = re.compile(reg) #编译
	imglist = reg_img.findall(htmlcode.decode('utf-8'))
	x = 0
	for img in imglist:
		urllib.request.urlretrieve(img, 'C:\\Users\\10129\\Desktop\\python\\img\\%s.jpg' %x)
		print(img)
		x += 1	
	
#写到txt里面去
def write2txt(htmlcode):
	pageFile = open("C:\\Users\\10129\\Desktop\\python\\pageCode.txt","wb+")
	pageFile.write(htmlcode)
	pageFile.close()

print ("--------网页图片抓取---------")
print ("请输入url："),
url = input()
if url:
	pass  # 不做任何事情，用作占位符
else:
	print ("-----没有地址使用默认地址-------")
	url = 'http://tieba.baidu.com/p/1753935195'
htmlcode = get_html(url)
write2txt(htmlcode)
get_image(htmlcode)
print("FINISH!!!")

猜你喜欢

转载自blog.csdn.net/qq_36092584/article/details/81192078

Python3爬虫入门第一课

爬虫入门第一课

入门Python爬虫第一课---Python3安装与环境搭建

Python（一）之入门第一课

python入门第一课练习

python快速入门第一课

【Python爬虫】第一课

java入门第一课

makefile 入门第一课

spring boot 入门第一课

jQuery入门第一课

JavaScrip 入门第一课

Hadoop入门第一课

JS极速入门第一课

VueJS + TypeScript 入门第一课

typescript入门第一课

C#入门第一课

算法入门第一课

Tensorflow1入门第一课

Python学习day01-python入门第一课，python简介

Python入门第一课——Python的起源、发展与前景！

菜鸟的Python入门第一课--Pycharm安装和简单使用

python 语言学入门第一课必看：编码规范

Python入门第一课，安装海龟编辑器。

【python】入门第一课：了解基本语法（数据类型）

Python学习第一课（安装IDE和Python3)

[C语言] 第一章|C语言入门第一课

[C] 第一章|C语言入门第一课

python爬虫第一课开发环境配置

【大麦小米学量化】量化基础之Python编程（小白入门第一课）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)