python初级实战系列教程《一、爬虫之爬取网页、图片、音视频》

python基础知识可以到廖雪峰大佬的官网学习哦!
廖雪峰官网网址

学完python就开始我们的实战吧!首先我们就来学习下python爬虫
学习Python爬虫,先是介绍一个最容易上手的库urllib,非常适合学习爬虫。

**

1、爬取网页

**

import urllib.request
#爬取百度网页html
baidu_url = "http://www.baidu.com"
result = urllib.request.urlopen(baidu_url)
#读取
html = result .read()
#解码并打印出来
print(html.decode('utf-8'))


# url中包含汉字是不符合URL标准的,需要进行编码
# 编码后:http%3A//www.%E7%88%AC%E8%99%AB.com
urllib.request.quote('http://www.爬虫.com') 

# 解码后:http://www.爬虫.com
urllib.request.unquote('http%3A//www.%E7%88%AC%E8%99%AB.com') 

**

2、爬取二进制文件

**

1)爬取图片

import urllib.request
#图片url,我们百度首页logo下载下来
picture_url = "https://www.baidu.com/img/bd_logo1.png"
result = urllib.request.urlopen(picture_url)
picture = result.read()
#创建图片文件
with open("baidu_logo.png", "wb") as f:
    #写入二进制数据
    f.write(picture)

2)爬取音频

import urllib.request
#歌曲url,我们就下载一首王力宏的改变世界吧
audio_url = "http://m10.music.126.net/20180302001718/2da3721ebef7f851cf8e39a9ebe30327/ymusic/cd72/f24d/bd25/ccd471214e64e65f541297a7bdf1cd62.mp3"
result = urllib.request.urlopen(audio_url)
audio = result.read()
#创建mp3文件
with open("change_word.mp3", "wb") as f:
    #写入二进制数据
    f.write(audio)

顺便告诉大家一个获得音乐下载链接的方法,以后想听什么歌都可以免费下载了
顺便告诉大家一个获得音乐下载链接的方法,以后想听什么歌都可以免费下载了

3)爬取视频

import urllib.request
#视频url,就下载下人人车的广告视频吧(因为它比较小)
video_url = "http://113.113.73.41/r/baiducdngdct.inter.iqiyi.com/videos/other/20180212/07/5c/8747c90718618294a6d122f6b02ee090.f4v"
result = urllib.request.urlopen(video_url)
video = result.read()
#创建视频文件
with open("ad.f4v", "wb") as f:
    #写入二进制数据
    f.write(video)

今天就到这吧,是不是很简单呀!哈哈…
如果觉得对您有帮助
我,秦始皇,打赏!

这里写图片描述

这里写图片描述

猜你喜欢

转载自blog.csdn.net/yzwty/article/details/79418793