爬虫系列之淘宝商品爬取 - 代码天地

爬虫系列之淘宝商品爬取

其他 2018-05-25 18:26:45 阅读次数: 0

 1 import re
 2 import requests
 3 
 4 def getHTMLText(url):
 5     try:
 6         r = requests.get(url, timeout = 30)
 7         r.raise_for_status()
 8         r.encoding = r.apparent_encoding
 9         return r.text
10     except:
11         return ""
12 
13 
14 def parsePage(ilt, html):
15     try:
16         plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html)
17         tlt = re.findall(r'\"raw_title\"\:\".*?\"', html)
18         for i in range(len(plt)):
19             price = eval(plt[i].split(":")[1])  #eval就是将字符串string对象转化为有效的表达式参与求值运算返回计算结果
20             title = eval(tlt[i].split(":")[1])
21             ilt.append([price, title])
22     except:
23         print("")       
24 
25 def printGoodsList(ilt):
26     tplt = "{:4}\t{:8}\t{:16}"  #规定输出格式
27     print(tplt.format("序号", "价格", "商品名称"))
28     count = 0
29     for g in ilt:
30         count = count + 1
31         print(tplt.format(count, g[0], g[1]))
32     print("")
33 
34 def main():
35     goods = '书包'
36     depth = 2
37     start_url = 'https://s.taobao.com/search?q=' + goods
38     infoList = []
39     for i in range(depth):
40         try:
41             url = start_url + '&s=' + str(44*i)
42             html = getHTMLText(url)
43             parsePage(infoList,html)
44         except:
45             continue
46     printGoodsList(infoList)
47 
48 
49 main()

猜你喜欢

转载自www.cnblogs.com/zyb993963526/p/9090107.html

爬虫系列之淘宝商品爬取

python爬虫爬取淘宝商品的销量

爬虫爬取淘宝商品信息

爬取淘宝商品

python爬虫之requests库传递cookies(爬取2019淘宝网商品列表)

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

Python爬虫入门实例一之淘宝商品页面的爬取

Python爬虫之淘宝数据爬取（商品名称，价格，图片，销量）

python爬虫 — 爬取淘宝商品信息

python爬虫爬取淘宝网商品信息

网络爬虫爬取淘宝商品页面数据

Python爬虫爬取淘宝，京东商品信息

python 爬取淘宝商品

Python爬虫实例之淘宝商品比价定向爬取！爬虫还是很有意思的！

python爬虫爬取淘宝商品比价（附淘宝反爬虫机制解决小办法）

python学习之爬取淘宝商品信息

python爬取淘宝商品比价实例（对re库的使用，淘宝反爬虫机制的解决）

Python爬取淘宝商品失败---解决：淘宝的反爬虫机制 - http重定向问题

我要爬爬虫(11)-用selenium爬取淘宝商品信息

爬虫系列之股票信息爬取

《爬虫系列之爬取PPT》

爬取千万淘宝商品的python脚本

python爬取淘宝商品数据

使用Selenium爬取淘宝商品

利用selenium爬取淘宝商品

淘宝商品爬取并存到mysql

Python爬取淘宝商品信息

爬取淘宝商品信息

python-爬取淘宝商品

Python爬取淘宝商品失败---解决

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)