Python：用socket模块请求网页数据时，报301,302的解决办法 - 代码天地

Python：用socket模块请求网页数据时，报301,302的解决办法

其他 2020-01-26 11:16:44 阅读次数: 0

最近在搞socket，要请求B站的数据，但是代码写出来总是报301

import socket

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
addr = ("www.bilibili.com", 443)
s.connect(addr)

s.send("GET / HTTP/1.1\r\nHost: www.bilibili.com\r\n\r\n".encode("utf-8"))
while True:
    response = s.recv(8192)
    if not len(response):
        break
    print(response.decode("utf-8"))

运行后信息如下图
在这里插入图片描述
注意图中的重定向指向了一个https！！！
接着就是百度，其中有一篇文章说到http和https的区别
可能要发送不同的请求，于是我首先进行了如下改进：

import ssl

s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client = ssl.wrap_socket(s)

由此可以发送https请求
再试了一下发现依然没有成功，结果如下
在这里插入图片描述
这一次报的是302，并且返回了一个很复杂的子路径
#解决办法：
最终没能从网上找到合适的解决办法
我综合以前学爬虫时遇到的问题，会不会是网站简单的防御机制，要不要再改一下get请求
于是我从Chrome中复制了User-Agent,加到了get中
并且把那个子路径也加上了。。。可能不加也行吧，但是我保险起见就加了
终于成功！
在这里插入图片描述
最终代码的如下

import socket
import ssl

s = ssl.wrap_socket(socket.socket(socket.AF_INET, socket.SOCK_STREAM))
addr = ("www.bilibili.com", 443)
s.connect(addr)

s.send("GET / HTTP/1.1\r\nHost: www.bilibili.com\r\nUser-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) \
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36\r\n\r\n".encode("utf-8"))
while True:
    response = s.recv(8192)
    if not len(response):
        break
    print(response.decode("utf-8"))

CxsGhost

发布了28 篇原创文章 · 获赞 74 · 访问量 1675

私信关注

猜你喜欢

转载自blog.csdn.net/CxsGhost/article/details/103281405

Python：用socket模块请求网页数据时，报301,302的解决办法

重定向（301,302）

nginx的301,302跳转

爬虫301,302问题

PHP的301,302自动跳转代码

php获取网页301,302后的真实地址,支持多重跳转

Python抓取网页数据的终极办法

python 请求网页数据get

Winform学习(7)--HttpWebRequest下载网页数据(包括意外情况解决办法)

网页报404解决办法

Nodejs发送https Post请求时出现socket hang up错误的解决办法汇总

怎么用Python写爬虫抓取网页数据！

怎么用Python写爬虫抓取网页数据

SQL：在重命名SqlServer数据库时,报5030错误的解决办法

python中使用csv模块写入数据时总有空一行的解决办法

HttpClient 4.1 post 继续访问重定向,301,302 的url

C#请求网页数据的方法

网页加载时左右抖动解决办法

python3爬虫Scrapy框架解决URL被重定向无法抓取到数据问题，显示301/302状态码

python 用socket向网页发送 GET 请求

python中csv模块写文件时总是空一行的解决办法

【python】用csv模块的writerow()写入文件总有空行的解决办法

Post和Get请求时出现乱码解决办法

在PyCharm用xlwt模块把数据写入了EXCEL文件后出现错误的解决办法

Python报“TypeError:abytes-likeobjectisrequired,not‘str’”解决办法

logstash导入数据到elasticsearch时，报找到超过一个mapping type的解决办法

Mysql更新数据时，报 “You can't specify target table 'message ' for update in FROM clause” 解决办法

socket closed解决办法

python3中用HTMLTestRunner.py报ImportError: No module named 'StringIO'解决办法

【oracle】oracle分页排序，出现页数不同数据却重复问题的原因及解决办法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)