电影url 批两下载的思路和代码

其他 2018-09-04 15:50:59 阅读次数: 0

import requests,re
from zhouliu.class_tt import class_tt

实例化一个添加数据到数据库的类

dytt_mysql=class_tt()
m=0
for i in range(1,5):
url=’http://www.dytt8.net/html/gndy/china/list_4_%d.html‘% i
print(url,’==’*50)
# url=’http://www.37cs.com/html/click/8040_2134.html’

headers={
    'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36'
}
response=requests.get(url,headers)
partten='<a href="(.*)" class="ulink">'
# with open('dytt.html','wb') as ff:
#     ff.write(response.content)
html_text=response.text
res_url=re.findall(partten,html_text)
# print(len(res_url))

for res_all_url in res_url:
    res_one_url='http://www.dytt8.net/'+res_all_url

    sql='insert into dytt values(null,{})'.format(repr(res_one_url))
    dytt_mysql.add_pymysql(sql)
    # print(res_one_url)

电影天堂的爬取思路

《1》首先根据在浏览器中输入域名找到url 和下载网址

《2》获取url 并发现并不完整且页码毫无规律可言

《3》把url 的前半段改为http://www.dytt8.net 发现页码有规律了

《4》顺利爬取网站所有的url

猜你喜欢

转载自blog.csdn.net/chengjintao1121/article/details/81865211

电影url 批两下载的思路和代码

网络爬虫（四）电影天堂电影下载

利用迅雷下载电影

漫威电影下载

电影下载网址

爬取电影天堂最新电影的名称和下载链接

URL和URL

电影《源代码》理解

星战代码小电影

上传电影代码

电影url点击次数统计功能设计

下载URL包含Signature和OSSAccessKeyId的实战代码

电影

看了两部电影

如何找到电影的下载链接

python爬取电影并下载

python3批量抓取电影天堂下载链接

绝对url和相对url

redirect:url和url的区别

爬取豆瓣电影代码

URL.createObjectURL和URL.revokeObjectURL用法说明及文件下载代码封装

url链接优化思路

【思路】-URL重写

猫眼电影和电影天堂数据csv和mysql存储

[Java] 用java实现的电影天堂,飘花电影网的电影的下载地址抓取

电影和电视Movies and TV

战略合作：互联网电影和民族电影

爬取电影天堂电影列表和详情页

给用户推荐电影，输出电影的名称和时间

电影代码升级，你输入什么类型电影就能看到什么类型电影

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)