目次
1. 目標 1: Seesion を使用してリクエストを入力する
1. 目標 1: Seesion を使用してリクエストを入力する
(1) 申請:
セッション オブジェクトを作成して、返されたデータ パケットをリクエストしてクロールします。
シナリオ: クロールするためにログインが必要な Web サイト
役割: セッション オブジェクトは、複数のリクエスト間でログインしたままにすることができます。
(2) 手順:
ステップ 1: セッション オブジェクトを作成する
ステップ 2: ログインをシミュレートしてセッションを取得する
ステップ 3: Cookie を保持し、セッションを使用してクロールする
ステップ 4: データパケットの処理
(3) コード部分:
import requests
data = {}
headers1={}
#part1:
# 创建一个session对象
session = requests.Session()
#part2:
# 发送POST请求(登录,数据包我就不带了,简写一下)
response = session.post(login_url,json=data)
#part3:
#需要携带cookie
headers2={}
# 发送GET请求进行爬取
response = session.get('https://baidu.com')
# 设置响应的编码方式为UTF-8
response.encoding = 'utf-8'
# 获取返回的数据包
#part4:
data = response.text
print(data)
# 处理数据包
# ...
# 关闭session
session.close()
2. ネットワークセキュリティ
GitHub - BLACKxZONE/Treasure_knowledge https://github.com/BLACKxZONE/Treasure_knowledge