Primer intento del rastreador web de Python


// Usa Python para tomar la página especificada
importar urllib.request
url = "http://www.baidu.com"
datos = urllib.request.urlopen (url) .read ()
data = data.decode ('UTF-8')
imprimir (datos)

// Una breve mirada a los atributos del valor de retorno de openurl
importar urllib.request
url = "http://www.baidu.com"
datos = urllib.request.urlopen (url) .read ()
data = data.decode ('UTF-8')
a = urllib.request.urlopen (url)
escribe un)
<clase 'http.client.HTTPResponse'>
a.geturl
<método enlazado HTTPResponse.geturl de <objeto http.client.HTTPResponse en 0x103555d68 >>
a.geturl ()
'http://www.baidu.com'
a.info ()
<objeto http.client.HTTPMessage en 0x10356e0f0>
a.getcode ()
200





importar urllib
importar urllib.request

datos = {}
datos ['palabra'] = 'Notas Jecvay'
url_values ​​= urllib.parse.urlencode (datos)
url = "http://www.baidu.com/s?"
full_url = url + url_values
datos = urllib.request.urlopen (full_url) .read ()
data = data.decode ('UTF-8')
imprimir (datos)

Supongo que te gusta

Origin blog.csdn.net/clarence20170301/article/details/76522157
Recomendado
Clasificación