requests爬取猫眼电影403错误解决方法 - 代码天地

requests爬取猫眼电影403错误解决方法

其他 2019-01-10 23:35:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/weixin_40567229/article/details/84545576

原代码如下:

import requests
from requests.exceptions import RequestException


def one_page_code(url):
    try:
        page = requests.get(url)
        if page.status_code == 200:
            return page.text
        print("Failed\n状态码为%d"%(page.status_code))
    except RequestException:
        print("Exception")

def main():
    url = 'http://maoyan.com'
    print(one_page_code(url))

if __name__ == '__main__':
    main()

这个代码无论是请求百度、淘宝还是豆瓣都能正常的显示出网页源代码，但是在爬取猫眼时却返回403错误

原来请求网页的过程中，忽略了很重要的一点，就是请求头

我们在浏览器检查元素中把network中的请求头复制出来，添加到请求函数中

import requests
from requests.exceptions import RequestException


def one_page_code(url):
    try:
        header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'}
        page = requests.get(url,headers = header)
        if page.status_code == 200:
            return page.text
        print("Failed\n状态码为%d"%(page.status_code))
    except RequestException:
        print("Exception")

def main():
    url = 'http://maoyan.com/board/4'
    print(one_page_code(url))

if __name__ == '__main__':
    main()

就可以正常获取到网页的源代码了

猜你喜欢

转载自blog.csdn.net/weixin_40567229/article/details/84545576

requests爬取猫眼电影403错误解决方法

svn 403错误解决方法

使用常规方法爬取猫眼电影

爬取猫眼电影

猫眼电影爬取

Requests + 正则表达式爬取猫眼电影

requests爬取猫眼电影top100

requests和lxml爬取猫眼电影TOP100

python学习(23)requests库爬取猫眼电影

requests正则表达式爬取猫眼电影

requests+正则爬取猫眼电影前100

telnet 403 400错误解决方法

django post请求 403错误解决方法

django post请求 403错误解决方法 django post请求 403错误解决方法

爬取猫眼电影排名

python爬取猫眼电影

猫眼电影票房爬取

爬虫，爬取猫眼电影

猫眼电影影评爬取

爬取猫眼电影数据

多种方法爬取猫眼电影并分析（附代码）

猫眼电影&经典电影爬取

Requests+正则表达式爬取猫眼电影

用Requests+正则表达式爬取猫眼电影

requests+正则爬取猫眼电影并将数据存储到mysql数据库

猫眼电影爬取(二)：requests+beautifulsoup，并将数据存储到mysql数据库

猫眼电影爬取(三)：requests+pyquery，并将数据存储到mysql数据库

利用Python3的requests和re库爬取猫眼电影笔记

python实战笔记之（1）：Requests+正则表达式爬取猫眼电影

【Python】Requests+正则表达式爬取猫眼电影TOP100

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)