初学者用python写爬虫就这么简单 - 代码天地

初学者用python写爬虫就这么简单

其他 2018-08-27 14:07:13 阅读次数: 0

很多人害怕python复杂，还没入门就被吓倒了，今天我就要证明个大家看，python很简单。（高手们就别提底层了，留点入门的信心我们吧，我们就写个爬虫玩玩，玩玩而已。）使用python写一个入门级的非常简单的爬虫。

#第一种方法

import urllib2 #将urllib2库引用进来
response=urllib2.urlopen("http://www.xiaofamao.com") #调用库中的方法，将请求回应封装到response对象中
html=response.read() #调用response对象的read（）方法，将回应字符串赋给hhtml变量
print html #打印出来

#第二中方法

import urllib2
req=urllib2.Request("http://www.xiaofamao.com")
response=urllib2.urlopen(req)
html = response.read()
print html

一般情况下，上面的爬虫，如果大量爬行，会被限制访问，所以要伪装成浏览器进行访问
这里用伪装成IE9.0进行访问

#要求请的url地址

import urllib2
url="http://www.xiaofamao.com"
#要伪装的浏览器user_agent头
user_agent="Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36;"
#创建字典，使请求的headers中的’User-Agent‘：对应user_agent字符串
headers={'User-Agent':user_agent}
#新建一个请求，将请求中的headers变换成自己定义的
req =urllib2.Request(url,headers=headers)
#请求服务器，得到回应
response=urllib2.urlopen(req)
#得到回应内容
the_page=response.read()
#打印结果
print the_page

猜你喜欢

转载自blog.csdn.net/i_like_cpp/article/details/79980379

初学者用python写爬虫就这么简单

python初学者学习笔记（一）简单的爬虫

Python初学者之网络爬虫

初学者写Python爬虫的四大工具

python 初学者

python初学者

如何编写python脚本?教你做简单的爬虫，适合初学者

C语言简单入门教程（初学者用）

Python爬虫初学者需要准备什么？

初学者的分布式Python爬虫教程

Python爬虫初学者需要了解的知识与技能

使用Python进行爬虫的初学者指南

Python爬虫入门(一)（适合初学者）

适合初学者的python爬虫代码实现

初学者路径规划 | 人生苦短我用Python

祖传Python代码，初学者必用，含泪发出

Python初学者常犯的简单错误集合与练习

Python初学者随笔

Python初学者指南

python初学者记录

初学者对Python的认知

python初学者（二）

致 Python 初学者

爬虫初学者安装学习环境

这是个初学者写的博客

写javaEE初学者的我

Python 多线程就这么简单

【转载】python 多线程就这么简单

Python 识别文本情感就这么简单

用Python写简单的爬虫

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)