2-2-1 根据豆瓣API爬取电影评分练习和作业更改（版本：py3）

其他 2018-09-04 18:11:13 阅读次数: 0

版权声明：自学笔记，如有引用请标明博客，感谢 https://blog.csdn.net/feng_jlin/article/details/81943894

目录

一、课程所用API爬取豆瓣电影评分程序注释（根据豆瓣电影编号）

二、课程作业API爬取豆瓣电影评分程序注释（根据豆瓣电影名称）

一、课程所用API爬取豆瓣电影评分程序注释（根据豆瓣电影编号）

# coding: utf-8

# In[ ]:


import urllib.request as urlrequest
import json

id_list = [26387939, 25882296, 26752088]

with open("douban_movie_rank.txt","w") as outputfile: # w是重写，a是追加
    for id in id_list:
        url_visit = 'https://api.douban.com/v2/movie/subject/{}'.format(id) #{}后加.format()即是在大括号中加入format()里的内容
        crawl_content = urlrequest.urlopen(url_visit).read() #利用Python读取url的核心代码
        json_content = json.loads(crawl_content.decode('utf8')) #利用 python 解析 JSON 代码
        
        #print(crawl_content.decode('unicode-escape'))
        #print(json_content['rating']['average'])
        
        rank = json_content['rating']['average'] #json_content列表下的嵌套列表rating中的average元素
        outputfile.write("{} {}\n".format(id,rank))

二、课程作业API爬取豆瓣电影评分程序注释（根据豆瓣电影名称）

import urllib.request as urlrequest
import urllib.parse as urlparse
import json

name_list=['异形：契约','摔跤吧！爸爸','速度与激情8']

for name in name_list:
    
    id = urllib.parse.quote(name) #这里需要将中文名转换为网页链接中能够读取的编码
    
    url_visit = 'https://api.douban.com/v2/movie/search?q={}'.format(id) #根据API格式更改
    crawl_content = urlrequest.urlopen(url_visit).read()
    json_content = json.loads(crawl_content.decode('utf-8'))
    
    rank = json_content['subjects'][0]['rating']['average']
    id1 = json_content['subjects'][0]['id']
    
    with open('douban_movie_rankother.txt','a') as outputfile:
        outputfile.write('{} {} {}\n'.format(name,id1,rank))

猜你喜欢

转载自blog.csdn.net/feng_jlin/article/details/81943894

2-2-1 根据豆瓣API爬取电影评分练习和作业更改（版本：py3）

2-6 应用案例：爬取豆瓣 TOP250 电影信息并存储（版本：py3）

2-6-1 应用案例：爬取豆瓣 TOP250 电影信息并存储（版本：py3）——学习笔记

2-6-2 应用案例：爬取豆瓣 TOP250 电影信息并存储（版本：py3）——转载其他写法并保存到EXCEL

实验2-2-1 计算分段函数[1]

2-6-6 应用案例：爬取豆瓣 TOP250 图书信息并存储（版本：py3）——学习笔记

2-1-2 Python for 循环语句练习（版本：py3）

2-2 基于 API 的爬虫（版本：py3）

2-1-1 Python while 循环语句练习（版本：py3）

实验2-2-1 计算分段函数[1] (10分)

实验2-2-1 计算分段函数[1] (10 分)

流程控制语句--------选择结构switch(2-2-1)

PHP-面向对象-类常量设置-2-2-1

【ybt高效进阶2-2-1】字符串哈希

2-2-1 分布式集群时钟同步问题及解决方案

2-2-1 一致性Hash问题及解决方案

神经网络例程-编一个（2-2-1）神经网络实现异或逻辑运算

爬虫练习（1）-- 爬取豆瓣最新电影

2-5-1 网络爬虫高级技巧：使用代理和反爬虫机制（版本：py3）——学习笔记

爬取豆瓣电影评分前250部电影

2-3-1 网页爬虫所需的 HTML 基础（版本：py3）——学习笔记

python基础(1):py2和py3编码讲解

1-2 Python环境配置及相关工具包安装（版本：py3）

2-4-1 基于 HTML 的爬虫，Python（Beautifulsoup）实现（版本：py3）——学习笔记

py3和py2的差别（补充）

2-4-2 基于 HTML 的爬虫，Python（Beautifulsoup）实现（版本：py3）——课后练习

计算1^2 - 2^2 + 3^2 - 4^2… 97^2 - 98^2 + 99^2

Python爬虫入门 | 2 爬取豆瓣电影信息

2020/2/28 爬取豆瓣网电影

【爬虫Practice2】爬取豆瓣高分电影

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)