python3简单爬虫，访问百度 - 代码天地

python3简单爬虫，访问百度

其他 2018-09-12 00:00:32 阅读次数: 0

前几天把python基础看完，自己动手做了个小练习，写下这篇博客留作纪念。以下代码简单写了三种方式去访问百度界面并且拿到页面的数据（源码），由于页面数据太多，所以只打出了页面的长度。

# python3中用urllib.request表示python2中的urllib2
import urllib.request as urllib2
# python3中用http.cookiejar表示python2中的cookielib
import http.cookiejar as cookielib

print ("第一种方式")
# 需要访问的url
url="https://www.baidu.com"
response=urllib2.urlopen(url)
# 返回一个数值结果，200表示正常
print (response.getcode())
# print(response.read().decode('utf-8'))    打印整个页面
# 打出页面的长度
print (len(response.read()))


print('第二种方式')
#伪装成浏览器对页面进行访问
request=urllib2.Request(url)
request.add_header("user-agent","Mozilla/5.0 (Windows NT 6.1; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0")
response1=urllib2.urlopen(request)
print (response1.getcode())
print (len(response1.read()))


print ("第三种方式")
#针对需要登录的网页
cj=cookielib.CookieJar()
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response3=urllib2.urlopen(url)
print (response3.getcode())
print (len(response3.read()))

 如有疑问，欢迎提问，本人定当竭尽所能为您解答

猜你喜欢

转载自blog.csdn.net/weixin_40169642/article/details/82420876

python3简单爬虫，访问百度

百度地图POI爬虫(Python3)

百度图片爬虫 python3实现

【学习笔记】python3 爬虫-百度图片

python3爬虫(2):使用Selenium爬取百度文库word文章

Python3爬虫爬取百度贴吧

python3编写爬虫从百度图库中爬取图片

Python3爬虫-selenium爬取百度文库

【Python3爬虫】百度一下，坑死你？

python3爬虫（5）百度云盘暴力破解尝试

Python3爬虫——利用百度翻译实现中文翻译英文

分享python3爬虫爬取百度上的图片

Python爬虫实战项目：简单的百度新闻爬虫

python3 关于函数封装简单介绍，以百度搜索为例子

python3 学习 3：python爬虫之爬取动态加载的图片，以百度图片为例

python3.x简单爬虫（爬取百度壁纸图片下载本地）

python3 爬取百度图片

使用python3爬取百度图片

Python3 调用百度翻译

python3百度设置高级搜索例子

Python3调用百度通用OCR

python3爬取百度图片

Python3 百度AI接口的应用测试

Python3爬取百度文库数据

python3实现百度翻译

《Python3网络爬虫开发实战》崔庆才 PDF 百度云下载

Python3网络爬虫(九)：使用Selenium爬取百度文库word文章

Python3网络爬虫--爬取百度搜索结果（附源码）

python3_爬虫_爬百度音乐

python简单爬虫爬取百度百科python词条网页

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)