python简单抓取页面数据实例

#coding=utf-8 

import urllib 

import re 

def getHtml(url): 

page = urllib.urlopen(url) 

html = page.read() 

return html 

def getImg(html): 

reg = r'src="(.+?\.jpg)" pic_ext' 

imgre = re.compile(reg) 

imglist = re.findall(imgre,html) 

x = 0 

for imgurl in imglist:

urllib.urlretrieve(imgurl,'%s.jpg' % x)

 x+=1 html = getHtml("http://www.chtml.cn/") 

print getImg(html)

猜你喜欢

转载自blog.csdn.net/joychen404/article/details/80737566