python爬虫1：第一个爬虫 - 代码天地

python爬虫1：第一个爬虫

其他 2020-02-19 10:34:06 阅读次数: 0

1。python2、3的库名不同，如果版本不同记得改。

Python2.x 有这些库名可用: urllib，urllib2，urllib3，httplib，httplib2，requests
Python3.x 有这些库名可用: urllib，urllib3，httplib2，requests

2。第一个简单的爬虫，获取链家当日房源数量

 1 #!/usr/bin/env python  
 2 # -*- coding: utf-8 -*-  
 3 # python3
 4 from urllib import request
 5 import re
 6 import time;  # 引入time模块
 7 
 8 today_date = time.strftime("%Y-%m-%d", time.localtime()) 
 9 gotpagebyte = request.urlopen("https://sz.lianjia.com/ershoufang/").read()
10 #python2里是urllib2.urlopen;此处获取到的是bytes，需要解码：
11 gotpagestr = gotpagebyte.decode('utf-8')
12 today_count_sz = re.match('.*count: (.*?),.*',gotpagestr,re.M|re.I|re.S).group(1)
13 print (today_date,today_count_sz)

3.虚拟环境。直接用root身份安装包时，对所有用户和项目起作用，有可能不同项目需要的包版本不同会冲突。因此可以设置虚拟环境，在虚拟环境中安装的包相对独立。先要安装python3-virtualenv。

在需要建立虚拟环境的目录下，运行virtualenv scraping。vfat分区会出现错误，貌似只能设置在linux分区中。

猜你喜欢

转载自www.cnblogs.com/cityfckr/p/12303945.html

python爬虫1：第一个爬虫

Python爬虫1：爬虫原理、网页构造与第一个爬虫程序

第一个Python爬虫

Python 第一个爬虫

python第一个爬虫

Python爬虫之第一个爬虫

Python爬虫入门——2. 1 我的第一个爬虫程序

第一Python第一个爬虫项目

python 爬虫《百炼成佛》爬虫入门（爬虫介绍）第一个爬虫程序

python-入门的第一个爬虫例子

python第一个爬虫脚本

我的第一个python爬虫

我的第一个用python写的爬虫

初学python第一个网络爬虫

我的第一个Python爬虫——谈心得

python篇-第一个爬虫程序

python第一个爬虫程序

python之Scrapy框架的第一个爬虫

Python--我的第一个爬虫

python 实现的第一个爬虫（待续）

第一个python爬虫小脚本

Python 第一个爬虫和测试

Python 作业（第一个爬虫和测试）

第一个python程序：爬虫下载课件

第一个简单的爬虫

第一个爬虫

我的第一个爬虫

第一个scrapy爬虫

第一个爬虫及测试

第一个爬虫测试

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)