Python爬虫：编写简单爬虫之新手入门

其他 2020-10-16 23:49:35 阅读次数: 0

最近整理了一下python的基础知识，大家一般对“爬虫”这个词，一听就比较熟悉，都知道是爬一些网站上的数据，然后做一些操作整理，得到人们想要的数据，但是怎么写一个爬虫程序代码呢？相信很多人是不会的，今天写一个针对新手入门想要学习爬虫的文章，希望对想要学习的你能有所帮助~~废话不多说，进入正文！

一、准备工作

1、首先代码使用python3.x编写的，要有一个本地的python3环境。

python下载地址页面：https://www.python.org/downloads/release/python-370/

2、然后要有一个开发工具，推荐PyCharm，一款很好的Python交互IDE。Python自带编译器 -- IDLE也可以。

PyCharm下载地址页面：https://www.jetbrains.com/pycharm/download/

3、准备工作都做好就可以做开发在IDE里编写代码程序了。

二、简单爬虫代码开发

以豆瓣网为例，爬取豆瓣官网页面，看看能获取到什么东西，代码如下：

代码：

# -*- coding: utf-8 -*-
import urllib.request
# 1、网址url --豆瓣网
url = 'http://www.douban.com'
# 2、直接请求返回结果
response = urllib.request.urlopen(url)
# 3、获取状态码，如果是200表示获取成功
print ('状态码：',response.getcode())
# 4、读取内容
data = response.read()
# 5、设置编码
data = data.decode('utf-8')
# 6、打印结果
print (data)

运行结果：

截取部分代码如下，第一行是状态码：200，表明获取成功，下面是爬取到的豆瓣页面代码，由于内容过多，故截取以下部分内容。

感兴趣的小伙伴可以动手试试，欢迎（进q群 467604262）交流~~

猜你喜欢

转载自blog.csdn.net/xixi20200/article/details/108972957

Python爬虫：编写简单爬虫之新手入门

Python爬虫（一）：编写简单爬虫之新手入门

python爬虫之爬取壁纸（新手入门级）

Python爬虫新手入门教学（九）：多线程爬虫案例讲解

Python新手入门之函数

Python爬虫新手入门教学（十五）：爬取网站音乐素材

Python爬虫新手入门教学（十三）：爬取高质量超清壁纸

Python爬虫新手入门教学（十一）：最近王者荣耀皮肤爬取

Python爬虫新手入门教学（七）：爬取腾讯视频弹幕

Python爬虫新手入门教学（十九）：爬取ip代理，构建代理池

Python爬虫新手入门教学（八）：爬取论坛文章保存成PDF

Python爬虫新手入门教学（六）：制作词云图

Python爬虫新手入门教学（十六）：爬取好看视频小视频

Python爬虫新手入门教学（十七）：爬取yy全站小视频

Python爬虫新手入门教学（十二）：英雄联盟最新皮肤爬取

Python爬虫新手入门教学（五）：爬取B站视频弹幕

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

Python爬虫新手入门教学（二）：爬取小说

Python爬虫新手入门教学（一）：爬取豆瓣电影排行信息

2021-11-03 Python爬虫新手入门第一步

Python爬虫新手入门教学（三）：爬取链家二手房数据

新手必看！简易入门Python爬虫

Python爬虫新手入门教学（十四）：爬取有声小说网站数据

Python爬虫新手入门教学（十）：爬取彼岸4K超清壁纸

Python爬虫新手入门教学（二十）：爬取A站m3u8视频格式视频

Python新手入门之字符串

Python新手入门之元组&集合

新手入门的Scrapy爬虫操作--超详细案例带你入门

19.2 Python入门之编写爬虫实战

kotlin之新手入门（1）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)