Recentemente, encontrei alguns problemas ao rastrear os dados da Bolsa de Valores de Hong Kong. A Bolsa de Valores de Hong Kong usa o protocolo http2.0, e a maioria do restante usa o protocolo http1.1, portanto, não pode ser rastreado. Por fim, verifica-se que o hiper é usado.
Primeira instalação: pip install hyper
Em seguida, importe hyper:
from hyper import HTTPConnection
Endereço do link da API: https://hyper.readthedocs.io/en/latest/index.html
Para usar o hyper crawling, a página inicial precisa adicionar a porta: 443, código:
//加入端口:443
conn = HTTPConnection('www.hkex.com.hk:443')
conn.request('GET', '/chi/stat/smstat/dayquot/d210219c.htm', None, None)
resp = conn.get_response()
//不解码返回的数据,源码中有示例,不传参入则默认utf-8
s = resp.read(decode_content=False)
print s
Isso é suficiente para uso preliminar, consulte a API para um uso mais aprofundado