爬虫入门一：BeautifulSoup解析豆瓣即将上映的电影信息 - 代码天地

爬虫入门一：BeautifulSoup解析豆瓣即将上映的电影信息

其他 2019-10-24 14:56:16 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_18505209/article/details/99765075

爬虫入门一

一直很想学习一下爬虫，今天忙里偷闲看了一篇教程博客之后开始入门学习，很感谢教程作者的讲解与分享，文末附教程博客链接。

BeautifulSoup解析豆瓣即将上映的电影信息

python代码：

import requests
from bs4 import BeautifulSoup
#1-1.先保存到文件，再进行解析
#1-1-1.获取网页信息保存到文件的过程
#url = "https://movie.douban.com/cinema/later/chengdu/"
#response = requests.get(url)
#file_obj = open('douban.html','w',encoding="utf-8")
#file_obj.write(response.content.decode('utf-8'))
#file_obj.close()
#1-1-2.从文件获取信息的过程
#file_obj = open('douban.html','r', encoding="utf-8")
#html = file_obj.read()
#file_obj.close()
#1-1-3.初始化BeautifulSoup，解析网页
#soup = BeautifulSoup(html, 'lxml')
#print(soup.find)

#1-2.直接抓取、解析
url = "https://movie.douban.com/cinema/later/chengdu/"
response = requests.get(url)
soup = BeautifulSoup(response.content.decode('utf-8'), 'lxml')
#2.获取并分析元素
all_movies = soup.find('div', id = "showing-soon")
#3.展示有用信息
for each_movie in all_movies.find_all('div', class_ = "item"):
    #print(each_movie)
    all_a_tag = each_movie.find_all('a')
    all_li_tag = each_movie.find_all('li')
    movie_name = all_a_tag[1].text
    movie_href = all_a_tag[1]['href']
    movie_date = all_li_tag[0].text
    movie_type = all_li_tag[1].text
    movie_area = all_li_tag[2].text
    movie_lovers = all_li_tag[3].text
    print('电影名：{},电影链接：{},放映日期：{},电影类型：{},上映地区：{},想看的人数：{}'.format(
        movie_name,movie_href,movie_date,movie_type,movie_area,movie_lovers))

输出：

附上学习链接：
爬虫入门教程⑧— BeautifulSoup解析豆瓣即将上映的电影信息.

猜你喜欢

转载自blog.csdn.net/qq_18505209/article/details/99765075

爬虫入门一：BeautifulSoup解析豆瓣即将上映的电影信息

BeautifulSoup解析豆瓣即将上映的电影信息

豆瓣即将上映电影爬虫作业

豆瓣上映电影爬虫

爬虫实践--豆瓣电影当前上映电影信息爬取

python scrapy爬取豆瓣即将上映电影用邮件定时推送给自己

使用python3 爬取豆瓣电影热映和即将上映

Python爬取豆瓣网中即将上映的电影数据清单

正在上映+即将上映

使用BeautifulSoup方法抓取豆瓣电影信息

Day 3【Datawhale】爬虫入门学习——实战一抓取豆瓣Top250电影信息

Python爬虫新手入门教学（一）：爬取豆瓣电影排行信息

Python爬虫入门 | 2 爬取豆瓣电影信息

Python爬虫入门 | 爬取豆瓣电影信息

【GPT】太强了！用gpt4分析下半年即将上映的电影

豆瓣电影(一)：网络爬虫

python08豆瓣电影爬虫 BeautifulSoup + Reuqests

爬虫实战(8)-爬取豆瓣网最近要上映的电影

python爬虫，爬取豆瓣电影信息

简单爬虫爬取豆瓣电影信息

使用selenium爬虫豆瓣电影信息

python爬虫爬取豆瓣电影信息

爬虫爬取豆瓣高分电影信息

爬取豆瓣正在上映的电影

Python爬取豆瓣Top250电影中2000年后上映的影片信息

python爬虫（一）爬取豆瓣电影排名前50名电影的信息

豆瓣电影页面python爬虫解析

【裁员警告】这是一段让各大电影网站的资料整理人员下岗的代码，用BeautifulSoup+urllib+python爬虫豆瓣top250电影详细信息，哪还需要低效的人力呢？

"天使杀人魔"被拍成电影将上映

Python爬虫入门之如何在豆瓣中获取自己喜欢的TOP N电影信息

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)