python3 爬虫抓取豆掰电影TOP 250 - 代码天地

python3 爬虫抓取豆掰电影TOP 250

其他 2018-12-26 16:00:18 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/a519395243/article/details/80207093

个人喜欢看电影，就去爬豆瓣上的电影Top榜，python入门不久，顺便学习练下

from urllib import request  
from bs4 import BeautifulSoup            #Beautiful Soup是一个可以从HTML或XML文件中提取结构化数据的Python库  
  
txt =''
top = 0
# 遍历豆瓣网站，爬虫分页数据
for i in range(10):
	start =i*25
	#构造头文件，模拟浏览器访问  
	url="https://movie.douban.com/top250?start="+str(start) 
	headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}  
	page = request.Request(url,headers=headers)  
	page_info = request.urlopen(page).read().decode('utf-8')#打开Url,获取HttpResponse返回对象并读取其ResposneBody  
	soup = BeautifulSoup(page_info ,'html.parser') #将html.parser作为解析器  
	info = soup.select('.info')

	for moive in info:
		top=top+1
		txt += 'Top'+str(top) + ' 电影名：'
		for title in moive.select('.hd .title'):
			txt += title.string
			pass
		
		txt += '  评分：'+moive.select('.bd .star .rating_num')[0].string
		txt +='\n\r' 

	#打开一个文件,window下需要加 utf-8 ,因为 新创建的文件默认为gbk
	fo = open("movietop.txt", "w",encoding='utf-8')

	#写入
	fo.write(txt)
	 
	# 关闭打开的文件
	fo.close()
#

战绩：

github: https://github.com/a519395243/Python_Item/

猜你喜欢

转载自blog.csdn.net/a519395243/article/details/80207093

python3 爬虫抓取豆掰电影TOP 250

python爬虫入门:豆瓣电影Top250抓取

Python爬虫一：抓取豆瓣电影Top250

Python爬虫抓取豆瓣top250电影

python爬虫——豆瓣电影Top250

【python爬虫】—豆瓣电影Top250

爬取豆瓣电影top250（python3）

python爬虫实战---豆瓣电影top250的电影信息抓取

python3爬虫豆瓣top250电影（并保存到mysql数据库）

Day 3【Datawhale】爬虫入门学习——实战一抓取豆瓣Top250电影信息

Python爬虫1-利用Scrapy抓取豆瓣电影top250数据

使用Python爬虫抓取某网站电影Top250并保存为Excel文件

python爬虫 —— 豆瓣电影top250电影

python抓取豆瓣电影top250信息

不会写Python代码如何抓取豆瓣电影 Top 250

Python 爬虫实践-豆瓣电影Top250（待续）

Python爬虫获取豆瓣电影TOP250

【Python】Scrapy爬虫实战（豆瓣电影 Top 250）

（十七）Python爬虫：爬取豆瓣电影TOP250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫爬取豆瓣电影TOP250

python爬虫——爬取豆瓣top250电影信息

Python 爬虫抓取豆瓣读书TOP250

Python3 Scrapy框架学习二：爬取豆瓣电影Top250

使用python3爬取豆瓣电影top250

python3 爬取豆瓣电影TOP250，漂亮表格彩色显示

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)