爬虫知识 - 代码天地

爬虫知识

其他 2018-11-29 00:41:22 阅读次数: 0

def progress(blk,blk_size,total_size):#当前下载量，每个量的大小，整个大小
      print "aa=%d\nbb=%d\ncc=%f%%"%(blk*blk_size,total_size,blk*blk_size/total_size)
filename,headers=urllib.urlretrieve("http://www.baidu.com","111.html",reporthook=progress) 自动创建文件并保存爬取的内容，显示下载进度

import urlparse
url="https://www.baidu.com/s?wd=bj&rsv_spt=1&rsv_iqid=0xc00e5ff600010317"
hh=urlparse.urlparse(url)
print hh
jj=urlparse.parse_qs(hh.query)
print jj                                                                                   解析url参数

import cookielib
url='https://www.baidu.com/'
request=urllib2.Request(url)
cook=cookielib.CookieJar()
cookhander=urllib2.HTTPCookieProcessor(cookiejar=cook)
opener=urllib2.build_opener(cookhander,urllib2.HTTPSHandler(debuglevel=1))
urllib2.install_opener(opener)
g=opener.open(request)
print g.read(100)                                                                          注册自定义opener，使用自定义功能

猜你喜欢

转载自www.cnblogs.com/qinyios/p/10035879.html

基础知识 - 爬虫

爬虫基础知识

爬虫的基础知识

爬虫_基础知识

爬虫的基本知识

爬虫基本知识及简单生成爬虫

爬虫------爬虫基础知识小结

python爬虫基础知识

Python爬虫：基础知识

【归纳】爬虫基础知识

爬虫必备基础知识

爬虫基础知识一

爬虫基础知识五

爬虫基础知识（肆）

爬虫基础知识（陆）

爬虫的基础知识（壹）

爬虫基础知识（伍）

爬虫基础知识（捌）

爬虫基础知识（玖）

爬虫基础知识（叁）

爬虫基础知识（柒）

python爬虫基本知识

爬虫基础知识回顾

爬虫------- 爬虫课程爬虫基础知识小结

Python爬虫基础知识及前期准备

爬虫基础-http请求的基础知识

爬虫相关法律知识

爬虫笔记（一）——基础知识整理

网络爬虫基础知识（Python实现）

网络爬虫基础知识（Java实现）

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

WebSocket、HTTP 与 TCP

private,public,protected的区别

Python用了这么多年，总结出超实用的功能和特点

dgwp笔记

ModuleNotFoundError: No module named 'gdbm'

数组的去重方法

Ternsorflow 学习：005-MNIST 实现模型

SpringBoot 2 源码学习笔记（二）

jaxws-spring 搭建Web Services笔记

读取properties文件并获取属性值

每日归档

更多

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)