python 爬虫（一）urllib使用demo - 代码天地

python 爬虫（一）urllib使用demo

其他 2019-01-03 02:35:32 阅读次数: 0

import urllib.request

#向指定的url地址发起请求，并返回服务器响应的数据（文件的对象）
response = urllib.request.urlopen("http://www.baidu.com")


#直接将文件写入指定路径，
filePath = r"C:/Users/zyy/PycharmProjects/untitled/爬虫/mile1.html"
response2 = urllib.request.urlretrieve(r"http://www.baidu.com",filePath)
urllib.request.urlcleanup() #清除缓存


'''
1)读取文件的全部内容
data = response.read()
'''

'''
2)读取一行，需要循环读取
data = response.readline()
'''

'''
3)读取所有行，并把读取到的数据赋值给一个列表变量  -->建议使用
data列表的每一条都是
data = response.readlines()
for dd in data:
    str = dd.decode("utf-8")  #将bytes字节转换成字符串
'''

'''
response的常用方法
1）response.info()
返回当前环境有关信息

2）response.getcode()
返回状态码
200     -->访问成功
304     -->客户已经执行了GET，但文件未变化（缓存）
404     -->网页不存在/url出错
500     -->服务器出现问题

3）response.geturl()
返回当前正在爬取的url地址
'''
data = response.readlines()
for dd in data:
    str = dd.decode("utf-8")
print(response.geturl())

filePath就是你想要保存爬取到的网页文件，最好是保存到html文件中，这个文件地址不存在的话程序会自动生成

猜你喜欢

转载自blog.csdn.net/weixin_40938748/article/details/85276514

python 爬虫（一）urllib使用demo

python爬虫（一）Urllib使用

Python爬虫——urllib的使用

Python爬虫(一) | urllib

【Python爬虫】urllib库的使用

python爬虫之urllib的使用

python爬虫urllib库使用

python爬虫，使用urllib + 正则

Python爬虫urllib库的使用

【Python爬虫】Urllib的使用（2）

Python爬虫开发——urllib的使用

python爬虫——urllib使用代理

python爬虫笔记（一）:urllib

Python爬虫学习笔记（一）——urllib库的使用

小白学 Python 爬虫（11）：urllib 基础使用（一）

python 爬虫基本库使用urllib之urlopen(一)

Python网络爬虫(一) | urllib包基本使用教程

Python爬虫基础（一）：urllib库的使用详解

python爬虫入门（一）urllib和urllib2同时使用

python爬虫学习——urllib、urllib2库的使用

python爬虫入门（一）urllib和urllib2

Python爬虫入门：Urllib库的高级使用

Python爬虫入门：Urllib库的基本使用

python爬虫入门urllib库的使用

python爬虫 urllib库基本使用

Python爬虫（二）urllib库的使用

python爬虫学习笔记-urllib的使用

Python爬虫 Urllib库的基本使用

Python爬虫之Urllib库的使用

python爬虫入门之urllib的简单使用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)