Python usa hyper para rastrear dados de páginas da web do protocolo http2.0

        Recentemente, encontrei alguns problemas ao rastrear os dados da Bolsa de Valores de Hong Kong. A Bolsa de Valores de Hong Kong usa o protocolo http2.0, e a maioria do restante usa o protocolo http1.1, portanto, não pode ser rastreado. Por fim, verifica-se que o hiper é usado.

        Primeira instalação: pip install hyper

        Em seguida, importe hyper:

from hyper import HTTPConnection

        Endereço do link da API: https://hyper.readthedocs.io/en/latest/index.html

        Para usar o hyper crawling, a página inicial precisa adicionar a porta: 443, código:

//加入端口:443
conn = HTTPConnection('www.hkex.com.hk:443')
conn.request('GET', '/chi/stat/smstat/dayquot/d210219c.htm', None, None)
resp = conn.get_response()
//不解码返回的数据,源码中有示例,不传参入则默认utf-8
s = resp.read(decode_content=False)
print s

        Isso é suficiente para uso preliminar, consulte a API para um uso mais aprofundado

Acho que você gosta

Origin blog.csdn.net/qq_41061437/article/details/113952370
Recomendado
Clasificación