python使用HTTP模版

做一个python使用http隧道做数据抓取的模板

以下是一个使用 Python 和 HTTP 隧道进行数据抓取的模板示例:

pythonimport requests

# 建立 HTTP 隧道

session = requests.Session()

session.mount('http://', requests.adapters.HTTPAdapter(pool_connections=10, pool_maxsize=10))

session.mount('https://', requests.adapters.HTTPAdapter(pool_connections=10, pool_maxsize=10))

# 设置要抓取的 URL

url = 'http://example.com/data'

扫描二维码关注公众号,回复: 15500105 查看本文章

# 发送 HTTP 请求并获取响应

response = session.get(url)

# 处理响应

if response.status_code == 200:

# 抓取成功,对响应内容进行处理

data = response.text

# ...

else:

# 抓取失败,处理错误

print(f'Error: ')

# 关闭 HTTP 隧道

session.close()在这个示例中,我们使用 requests 库建立了一个 HTTP 隧道,以便在抓取数据时通过代理进行访问。我们通过 session.mount() 方法将 HTTP 和 HTTPS 协议的适配器挂载到会话中,并设置了连接池的大小。

接下来,我们设置了要抓取的 URL,并使用 session.get() 方法发送 HTTP GET 请求。如果请求成功,我们可以通过 response.text 获取响应内容,并进行相应的处理。如果请求失败,我们可以获取错误状态码并进行处理。

最后,我们使用 session.close() 方法关闭 HTTP 隧道

#! -*- encoding:utf-8 -*-

    import requests

    # 要访问的目标页面
    targetUrl = "http://ip.hahado.cn/ip"

    # 代理服务器
    proxyHost = "ip.hahado.cn"
    proxyPort = "39010"

    # 代理隧道验证信息
    proxyUser = "username"
    proxyPass = "password"

    proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
        "host" : proxyHost,
        "port" : proxyPort,
        "user" : proxyUser,
        "pass" : proxyPass,
    }

    proxies = {
        "http"  : proxyMeta,
        "https" : proxyMeta,
    }

    resp = requests.get(targetUrl, proxies=proxies)

    print resp.status_code
    print resp.text

猜你喜欢

转载自blog.csdn.net/weixin_73725158/article/details/131451371
今日推荐