#python学习笔记#使用python爬取拉勾网职位信息（一）：环境配置及库安装 - 代码天地

#python学习笔记#使用python爬取拉勾网职位信息（一）：环境配置及库安装

其他 2018-07-24 05:11:06 阅读次数: 0

鄙人作为一个Android开发者，经常想私下做一些小项目，需要一些后台的配合，自己的项目用servlet和sql语句也能凑合，但缺少后台数据就比较难办了（假数据看起来很违和，而且没有实际意义）；听闻python可以做网络爬虫爬取数据，于是趁着这段时间开发任务不重，通过python实现了爬取网站数据的功能。

Python简介：

请自行百度...

Python安装：

1.先去官网下载python，根据自己的需要选择对应的版本：网址

2.解压下载下来的压缩包，然后根据提示进行安装。

3.设置环境变量，与java等环境变量类型，如图：

4.做完这些之后，python就算配置完成了，可以在控制行检测一下是否安装成功：

到此python就算配置成功了。

python编译工具：

python可以直接在命令行中进行编译，但是作为jetbrains的粉丝，当然不能错过jetbrains发布的python编译工作---PyCharm啦！

至此python的基本编译环境已经配置完成了，接下来需要导入一些编写爬虫程序的库了。

BeautifulSoup

在我看来，所谓爬虫就是将html抓取下来，然后分析其页面上的数据，python自带了html解析器--html parser，个人感觉用起来比较繁琐，因此推荐大家使用BeautifulSoup，功能比较强大，而且使用起来也比较方便。python安装第三方库还是比较方便的，有两种安装方式：

1.可以直接在命令行输入：pip install beautifulsoup4（python 2.0+用户）或者pip3 install beautifulsoup4（python 3.0+用户），之后等待安装完成即可。

2.去官网下载安装包，在命令行中先定位到安装包作为文件夹，执行python setup.py install即可

xlwt

xlwt是一款导出Excel表格的第三方python库，安装它是为了将获得的数据导出，方便查看，安装方法与上面类似。

好了，准备工作就都做好了，接下来，就该上代码了！

Python参考资料：

Python 基础教程（看原文文档当然是最好，不过这个也不错，可以当字典使用）

玩蛇网（顾名思义）

猜你喜欢

转载自blog.csdn.net/superyu1992/article/details/73796410

#python学习笔记#使用python爬取拉勾网职位信息（一）：环境配置及库安装

#python学习笔记#使用python爬取拉勾网职位信息（二）：爬取数据

对拉勾网职位信息的爬取（python）

Python 爬取拉勾网python职位信息

python爬虫— 拉勾网职位信息爬取

简单python爬虫爬取拉勾网职位信息

通过Python爬取拉勾网的职位信息

python requests爬取拉勾网职位信息

selenium爬取拉勾网python职位信息

使用scrapy爬取拉勾网职位信息

通俗易懂的分析如何用Python实现一只小爬虫，爬取拉勾网的职位信息

用Python爬取拉勾网的职位信息！给我要实习的表弟一些中肯的建议

python爬虫：爬取拉勾网职位并分析

Python爬取拉勾网数据分析职位

python爬虫: 爬取拉勾网职位并分析

练习1:python爬虫-爬取拉勾网职位

拉勾网爬取全国python职位并数据分析薪资，工作经验，学历等信息

python爬取拉勾网职位信息并进行数据分析

python爬虫（三）用request爬取拉勾网职位信息

Python爬虫实战：爬取拉勾网任意职位信息并保存到Mysql

python爬虫 —爬拉勾网python爬虫职位（一）

python3 scrapy 入门级爬虫爬取数万条拉勾网职位信息

scrapy爬虫-爬取拉勾网职位信息

scrapy爬虫之爬取拉勾网职位信息

爬取拉勾网职位信息并存为json文件

爬虫实战之全站爬取拉勾网职位信息

基于selenium爬取拉勾网职位信息

初级爬虫--爬取拉勾网职位信息

selenium+lxml爬取(查询)拉勾网职位信息

用selenium爬取拉勾网职位信息

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)