urllib.error.HTTPError: HTTP Error 403: Forbidden
urllib.error。HTTP错误403:禁止
引发这样的错误是因为,被爬的网址不允许没有头文件 因此让服务器拒绝访问,这是只需要加上头部就可以继续访问了,也就是模拟以浏览器的方式打开被爬的网页就可以了!!
email ="https://www.douyu.com/"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
req = urllib.request.Request(email, headers=headers)
或者打开浏览器 按F12 找到Network模块,找到User—Agent 复制里面的数据就可以了。