python爬虫爬取视频

通过5分钟的python学习,发现使用python爬虫下载视频真的是简单。

我爬取的是https://www.leimulamu.com/play/5d30393cf1caf4594813612b

这里使用谷歌浏览器(方便调试)

按f12先找一下视频传输过来的源头(也就是你为什么能看到画面),画面有好几种,最简单的是mp4

这里是一个一个ts包

然后这里我们需要requests导入这个Python模块,发送请求,下载视频

import requests
num=1
url='https://www.leimulamu.com/videos/201907/18/5d30393cf1caf4594813612b/21eg46/index'+num+'.ts'
print('开始下载')
r=requests.get(url,stream=True)
with open('C:/Users/10351/Desktop/RickAndMorty/ha.ts','wb') as mp4:
	for chunk in r.iter_content(chunk_size=1024 * 1024) :
		if chunk:
			mp4.write(chunk)
print('下载结束')	

这个num代表的是下载的哪个tx包,有人肯定问,我咋知道它总共有多少个ts包。

没关系这个不是个问题

你跳转到最后,点击一下,就会出现一个当前时间段的ts包,那样你就知道总共有多少个ts包了(当然这是前提你的网站是按照索引顺序来排序的)

扫描二维码关注公众号,回复: 8906468 查看本文章

这部动画在最后结尾的时候是116.ts我写个循环,改个num为116就,在来个递增,就能下完,这部影片了。

最后在利用某软件合并一下这些ts,就是一部完整的动画了。

下载结果

下面是整片影片的代码

import requests
num=0
while num<117:	
	url='https://www.leimulamu.com/videos/201907/18/5d30393cf1caf4594813612b/21eg46/index'+str(num)+'.ts'
	print('开始下载'+str(num))
	r=requests.get(url,stream=True)
	with open('C:/Users/10351/Desktop/RickAndMorty/'+str(num)+'第一集.ts','wb') as mp4:
		for chunk in r.iter_content(chunk_size=1024 * 1024) :
			if chunk:
				mp4.write(chunk)
	num += 1			
print('下载结束')			

5分钟写出爬虫的 参考资料:https://blog.csdn.net/liujiayu2/article/details/86137139

使用ffmpeg合并文件

https://www.jianshu.com/p/ddafe46827b7

发布了103 篇原创文章 · 获赞 23 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_38403590/article/details/103832824