python基础知识可以到廖雪峰大佬的官网学习哦!
廖雪峰官网网址
学完python就开始我们的实战吧!首先我们就来学习下python爬虫
学习Python爬虫,先是介绍一个最容易上手的库urllib,非常适合学习爬虫。
**
1、爬取网页
**
import urllib.request
#爬取百度网页html
baidu_url = "http://www.baidu.com"
result = urllib.request.urlopen(baidu_url)
#读取
html = result .read()
#解码并打印出来
print(html.decode('utf-8'))
# url中包含汉字是不符合URL标准的,需要进行编码
# 编码后:http%3A//www.%E7%88%AC%E8%99%AB.com
urllib.request.quote('http://www.爬虫.com')
# 解码后:http://www.爬虫.com
urllib.request.unquote('http%3A//www.%E7%88%AC%E8%99%AB.com')
**
2、爬取二进制文件
**
1)爬取图片
import urllib.request
#图片url,我们百度首页logo下载下来
picture_url = "https://www.baidu.com/img/bd_logo1.png"
result = urllib.request.urlopen(picture_url)
picture = result.read()
#创建图片文件
with open("baidu_logo.png", "wb") as f:
#写入二进制数据
f.write(picture)
2)爬取音频
import urllib.request
#歌曲url,我们就下载一首王力宏的改变世界吧
audio_url = "http://m10.music.126.net/20180302001718/2da3721ebef7f851cf8e39a9ebe30327/ymusic/cd72/f24d/bd25/ccd471214e64e65f541297a7bdf1cd62.mp3"
result = urllib.request.urlopen(audio_url)
audio = result.read()
#创建mp3文件
with open("change_word.mp3", "wb") as f:
#写入二进制数据
f.write(audio)
顺便告诉大家一个获得音乐下载链接的方法,以后想听什么歌都可以免费下载了
3)爬取视频
import urllib.request
#视频url,就下载下人人车的广告视频吧(因为它比较小)
video_url = "http://113.113.73.41/r/baiducdngdct.inter.iqiyi.com/videos/other/20180212/07/5c/8747c90718618294a6d122f6b02ee090.f4v"
result = urllib.request.urlopen(video_url)
video = result.read()
#创建视频文件
with open("ad.f4v", "wb") as f:
#写入二进制数据
f.write(video)
今天就到这吧,是不是很简单呀!哈哈…
如果觉得对您有帮助
我,秦始皇,打赏!