Python爬虫urllib之猫眼电影正则 - 代码天地

Python爬虫urllib之猫眼电影正则

其他 2019-03-24 11:20:59 阅读次数: 0

猫眼电影

 '''
利用正则爬取猫眼电影
-url:http://maoyan.com/board
-把电影信息拿下来
分析
-一个电影信息在dd的单元内
-找到每一个dd，用re按个查找需要的信息
'''
#1 把网页信息爬取下来
from urllib import request
url = 'http://maoyan.com/board'

rsp = request.urlopen(url)
html = rsp.read().decode()
with open("asp.html", "w",encoding='utf-8')as f:
    f.write(html)
# print(html)

#2 找到每个dd单元
import re

s = r'<dd>(.*?)</dd>'
pattern = re.compile(s, re.S)
films = pattern.findall(html)
print(len(films))

#3 提取出dd单元中需要的信息
for film in films:

    #提取电影名字
    s = r'<a.*?title="(.*?)"'
    pattern = re.compile(s)
    title = pattern.findall(film)[0]
    print(title)

猜你喜欢

转载自blog.csdn.net/qq_31235811/article/details/88770868

Python爬虫urllib之猫眼电影正则

Python爬虫练习之猫眼电影

python爬虫之正则表达式爬取猫眼前100的电影（七）

python爬虫学习之获取猫眼电影排名前10

python3 爬虫学习之爬取猫眼电影

Python爬虫入门实战之猫眼电影数据抓取！

Python爬虫实战之Requests+正则表达式爬取猫眼电影Top100

python爬虫--13 猫眼电影爬虫

爬虫之抓取猫眼电影排行

反爬虫之猫眼电影字体加密

Python爬虫爬取猫眼电影排行

python爬虫爬取猫眼电影数据

python爬虫----猫眼电影：最受期待榜

[Python爬虫]猫眼电影榜单爬取

python 爬虫正则表达式爬取猫眼电影top100榜

自学python爬虫（四）Requests+正则表达式爬取猫眼电影

Python爬虫-利用正则表达式爬取猫眼电影

Python爬虫：正则表达式爬取猫眼电影

python网络爬虫--正则表达式抓取猫眼电影排行TOP100

python爬虫，使用urllib + 正则

猫眼电影top100票房爬虫 Request + 正则

猫眼电影北美票房爬虫 Request + 正则加强训练

最热猫眼电影——爬虫

python爬虫之urllib

python实战笔记之（1）：Requests+正则表达式爬取猫眼电影

Python之爬取猫眼电影

Python爬虫之csv+PIL+BytesIO+re爬取猫眼电影排行（九）

Python爬虫入门实战之猫眼电影数据抓取(理论篇)

Python爬虫入门实战之猫眼电影数据抓取（实战篇）

Python爬虫学习案例之抓取猫眼电影排行Top100

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)