python urllib.error.HTTPError:HTTPエラー418:応答コード418 I'maティーポットは、Doubanを登る例を説明しています

爬虫被发现了,你就是一个茶壶

import urllib.request

url = "https://movie.douban.com/top250?start=%s&filter="
# # 构建请求对象
req = urllib.request.Request(url,)
# 请求并获取响应
response_1 = urllib.request.urlopen(req).read().decode('utf-8')
print(response_1)

エラーを報告するurllib.error.HTTPError: HTTP Error 418:

問題の原因:你是写的爬虫被发现了返回了418

解決策:ブラウザのふりをするためにヘッダーを追加します

import urllib.request
# 写一个headers
headers = {
    
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
url = "https://movie.douban.com/top250?start=%s&filter="
# # 构建请求对象
# 增加到请求对象中
req = urllib.request.Request(url,headers=headers)
response_1 = urllib.request.urlopen(req).read().decode('utf-8')
print(response_1)

HTTPレスポンスコード418
ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/weixin_45598506/article/details/112865645