python爬虫02 —爬取静态页面（豆瓣电影top250首页名称）

企业开发 2023-08-22 20:43:56 阅读次数: 0

# 导入requests和bs4两个库
import requests, bs4

# 准备基础数据，url和请求头
url = 'https://movie.douban.com/top250'
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.81 Safari/537.36'
}

# 封装请求方法
def getmoive(url):
    r = requests.get(url, headers=header, timeout=10)
    moive_lists = []
    soup = bs4.BeautifulSoup(r.text,'lxml')
    div_lists = soup.select('#content > div > div.article > ol > li > div > div.info > div.hd > a > span:nth-child(1)')
    for i in div_lists:
        moive = i.text.strip()
        moive_lists.append(moive)
    return moive_lists

# 执行和打印结果
moives = getmoive(url)
print(moives)

关于bs4的使用可以参考简书的这篇文章：

Python爬虫：史上最详细的BeautifulSoup教程

https://www.jianshu.com/p/424e037c5dd8

猜你喜欢

转载自blog.csdn.net/weixin_47930147/article/details/120783862

python爬虫02 —爬取静态页面（豆瓣电影top250首页名称）

python爬虫03 —爬取静态页面（爬取豆瓣电影top250若干页的电影名称及评分）

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫——爬取豆瓣top250电影信息

python爬虫爬取豆瓣电影TOP250

day02 爬取豆瓣电影top250

爬虫练习-爬取豆瓣电影TOP250的数据

爬虫实战：爬取豆瓣TOP250电影信息

【爬虫】爬取豆瓣Top250电影信息

爬取豆瓣电影top250（python3）

python爬取豆瓣电影Top250

python爬取豆瓣电影Top250的信息

用Python爬取豆瓣Top250的电影标题

python 豆瓣top250电影的爬取

python项目-爬取豆瓣top250电影信息

python爬取豆瓣电影Top250（小白系列）

Python 爬取豆瓣电影Top250

Python 豆瓣电影Top250爬取

(python)爬虫实战爬取豆瓣电影Top250榜单电影

day02 python从入门到放弃----爬取豆瓣电影Top250

python爬取豆瓣Top250

零基础爬虫----python爬取豆瓣电影top250的信息

python爬虫初学（一）爬取豆瓣电影Top250

用Python爬虫爬取豆瓣电影、读书Top250并排序

零基础爬虫----python爬取豆瓣电影top250的信息（转）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)