爬取视频解析网站的解析接口 - 代码天地

爬取视频解析网站的解析接口

其他 2018-05-24 16:21:46 阅读次数: 0

我的网站：www.liunian.online （流年在线vip视频解析）

空间到期没钱续费已关闭 (。•́︿•̀。)，等有钱吃饭了再买。当初建这个网站就是为了熟悉一下建站过程，用的解析接口都是从别人的网站拿的，源码也是从网上下载的233333333

正文：

想动手写一个爬取接口的爬虫，练练手。

不写不知道，一写吓一跳，动手能力确实差，以后还是要多写多练！

附上代码：

 1 import requests
 2 from bs4 import BeautifulSoup
 3 
 4 def get_htmltext(url):
 5     try:
 6         kv = {'user-agent':'mozilla/5.0'}
 7         r = requests.get(url,headers=kv,timeout=30)
 8         r.raise_for_status()
 9         r.encoding = r.apparent_encoding
10         return r.text
11     except:
12         return ''
13 
14 def get_api(html,ulist):
15     soup = BeautifulSoup(html,'html.parser')
16     op = soup.find_all('option')
17     for tag in op:
18         ulist.append(tag.attrs['value'])
19 
20 def save_api(ulist,path):
21     with open(path,'a') as f:
22         f.write('\n'+'---------(此次爬取接口如下)------------------------')
23         for api in ulist:
24             f.write('\n'+ api + '\n')
25         f.close()
26 
27 def main():
28     info = []
29     save_path = 'D://videoapi.txt'
30     url = 'http://' + input("输入要爬取的视频解析网站的网址：")
31     html = get_htmltext(url)
32     get_api(html,info)
33     save_api(info,save_path)
34 
35 main()

目瞪狗呆：原来会自动创建video.txt文件，原来。。。

代码还有很多可以优化的地方，先这样吧，我要去上课啦 ε=ε=ε=┌( ´°ェ°)┘

猜你喜欢

转载自www.cnblogs.com/zhiyuanxiong/p/9083433.html

爬取视频解析网站的解析接口

爬取网站招聘信息代码解析

解析网站robots.txt是否可以爬取

冰冰B站视频弹幕爬取原理解析

VIP视频解析网站

python 爬取 xml 并解析

爬取视频网站的视频

爬取视频网站视频并下载

实例解析|Python加解密VIP网站反爬请求头实现数据爬取!

最新的万能vip视频解析接口聚合网站

视频解析接口

vip视频解析接口

腾讯视频解析接口

搭建视频解析的接口

快手解析视频真实链接（爬取快手视频）

Python爬虫：爬取网站视频

用Python爬取影视网站，直接解析播放地址。

C# 爬取 “抖音“ 短视频无水印解析下载(超详细) 网络蜘蛛

scrapy爬取大众点评并解析？？

xpath 解析之爬取招聘信息

Python爬虫对json数据解析爬取

用Python爬取解析过的网页

java爬虫——HttpClient爬取jsoup解析

python之梨视频网站视频爬取及下载

Python爬取全民小视频网站视频，可爬取全站视频

通过解析js！来爬取优酷vip视频的真实播放地址！不可能充会员的

爬取小视频网站视频并下载——场库网站视频批量下载

爬虫Scrapy框架-2爬取网站视频详情

python爬取网站视频保存到本地

使用you-get爬取各大网站视频

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)