python爬虫03 —爬取静态页面（爬取豆瓣电影top250若干页的电影名称及评分） - 代码天地

python爬虫03 —爬取静态页面（爬取豆瓣电影top250若干页的电影名称及评分）

企业开发 2023-08-22 20:43:54 阅读次数: 0

import requests
import bs4
import time
# 定义请求头
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) /'
                 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'
}

# 定义获取页面和解析数据方法
def getinfo(url):

    response = requests.get(url,headers= headers)

    soup = bs4.BeautifulSoup(response.text, 'lxml')

    moives = []
    # 基于class选择器获取元素
    items = soup.select('div.hd > a > span:nth-child(1)')
    for item in items:
        name = item.string
        moives.append([name,0])
    # 基于find_all方法获取元素
    scors = soup.find_all(class_='rating_num')
    i = 0
    for item in scors:
        scor = float(item.string)
        moives[i][1] =scor
        i+=1

    print(moives)

# 循环获取若干页面的电影名称和评分并打印
for page in range(5):
    url = f'https://movie.douban.com/top250?start={page * 25}&filter='
    print(f'第{page+1}页数据如下：')
    getinfo(url)
    time.sleep(1)
print('打印完毕！')

猜你喜欢

转载自blog.csdn.net/weixin_47930147/article/details/120832483

python爬虫03 —爬取静态页面（爬取豆瓣电影top250若干页的电影名称及评分）

python爬虫02 —爬取静态页面（豆瓣电影top250首页名称）

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫——爬取豆瓣top250电影信息

python爬虫爬取豆瓣电影TOP250

Python爬虫小白教程（二）—— 爬取豆瓣评分TOP250电影

爬虫练习-爬取豆瓣电影TOP250的数据

爬虫实战：爬取豆瓣TOP250电影信息

【爬虫】爬取豆瓣Top250电影信息

爬取豆瓣电影top250（python3）

python爬取豆瓣电影Top250

python爬取豆瓣电影Top250的信息

用Python爬取豆瓣Top250的电影标题

python 豆瓣top250电影的爬取

python项目-爬取豆瓣top250电影信息

python爬取豆瓣电影Top250（小白系列）

Python 爬取豆瓣电影Top250

Python 豆瓣电影Top250爬取

(python)爬虫实战爬取豆瓣电影Top250榜单电影

爬虫实战爬取豆瓣电影Top250榜单电影

用python爬取豆瓣电影TOP250获取电影排名、电影名称、电影别名、电影链接、导演、主演、年份、地点、类型、评分、评价人数、摘要、海报下载地址。

利用python爬取豆瓣电影榜top250的电影名及其对应网址

零基础爬虫----python爬取豆瓣电影top250的信息

python爬虫初学（一）爬取豆瓣电影Top250

用Python爬虫爬取豆瓣电影、读书Top250并排序

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)