python爬虫-基础入门-爬取整个网站《1》

其他 2018-11-04 11:11:35 阅读次数: 0

python爬虫-基础入门-爬取整个网站《1》

描述：

　　使用环境：python2.7.15 ，开发工具：pycharm，现爬取一个网站页面（http://www.baidu.com）所有数据。

python代码如下：

 1 # -*- coding:  utf-8 -*-
 2 
 3 import urllib2
 4 
 5 def baiduNet() :
 6 
 7     request = urllib2.Request("http://www.baidu.com")
 8     response = urllib2.urlopen(request)
 9     netcontext = response.read()
10 
11     file = open("baidutext.txt","w")
12     file.write(netcontext)
13 
14 
15 if __name__ == "__main__" :
16     baiduNet()

执行后baidutext.txt数据，部分截图如下：

打开浏览器，访问百度，鼠标右键页面，查看源代码，如下：

使用代码爬取到的页面数据和源网站页面数据是一样的，爬取网页成功。

扫描二维码关注公众号，回复： 3924447 查看本文章

如有问题，欢迎纠正！！！

如有转载，请标明源处：https://www.cnblogs.com/Charles-Yuan/p/9903221.html

猜你喜欢

转载自www.cnblogs.com/Charles-Yuan/p/9903221.html

python爬虫-基础入门-爬取整个网站《1》

python爬虫-基础入门-爬取整个网站《3》

python爬虫-基础入门-爬取整个网站《2》

Python爬虫基础入门实战案例（爬取网站小说）

python爬虫入门（一）——爬取整个网页的源码

python简单爬虫，爬取整个页面

Python爬虫入门教程：爬取妹子图网站

Python爬虫入门【2】：妹子图网站爬取

Python爬取网站图片(爬虫入门demo)

python爬虫学习之路(1) 利用urllib爬取网站

一个菜鸟python网络爬虫入门学习记录——从爬取网站图片开始学习python（1）

python爬虫入门（1）简单爬取网页源码

doraemon的python 爬虫示例1（入门）动态数据的爬取

5分钟学会Python爬取整个网站

Python爬虫实战- 爬取整个网站112G-8000本pdf epub格式电子书下载

Python爬虫——爬取网站的图片

python爬虫爬取网站数据

python爬虫-爬取网站图片。

Python爬虫：爬取网站电影信息

Python爬虫爬取美剧网站

python 爬虫爬取某网站的漫画

Python爬虫爬取网站上的图片

Python爬虫：爬取网站视频

Python爬虫爬取网站小说

python爬虫爬取网站图片

python爬虫之爬取网站图片

python爬虫之爬取网站小说

python爬虫爬取网站小说

Python爬虫入门——爬取网页图片

python 爬虫入门--热点视频爬取

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)