python学习之爬取淘宝商品信息 - 代码天地

python学习之爬取淘宝商品信息

其他 2018-06-19 16:12:57 阅读次数: 2

import re
import requests
#获取淘宝搜索页面的html源码
def gethtmltext(url):
try:
r = requests.get(url, timeout = 30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return "产生异常"
#使用正则表达式解析源码中商品名称和商品价格
def resolveGoodsList(urlstr, glist):
try:
namepat = re.compile(r'"raw_title":".*?"')
pricepat = re.compile(r'"view_price":"\d*.\d*"')
namels = namepat.findall(urlstr)
pricels = pricepat.findall(urlstr)
for i in range(len(pricels)):
name = eval(namels[i].split(':')[1])
price = eval(pricels[i].split(':')[1])
glist.append([name, price])
except:
print("resolveGoodsList产生异常")

#打印商品价格和商品名称
def printGoodsList(glist):
pmat = "{:4}\t{:8}\t{:16}"
print(pmat.format("序号", "价格", "商品名称"))
count = 0
for g in glist:
count = count + 1
print(pmat.format(count, g[1], g[0]))

def main():
good = "书包"
urll = "https://s.taobao.com/search?q=" + good
deep = 2
glist = []
for i in range(deep):
url = urll + '&s=' + str(44*i)
htext = gethtmltext(url)
resolveGoodsList(htext, glist)
printGoodsList(glist)

main()

猜你喜欢

转载自blog.csdn.net/zenobia119/article/details/79431243

python学习之爬取淘宝商品信息

Python爬取淘宝商品信息

Python爬取淘宝商品信息入库

python爬虫 — 爬取淘宝商品信息

python爬虫爬取淘宝网商品信息

python：淘宝商品信息定向爬取

Python爬虫爬取淘宝，京东商品信息

python爬取并分析淘宝商品信息

Python爬取淘宝商品信息并生成Excel

爬虫爬取淘宝商品信息

爬取淘宝商品信息

Python进阶之借助selenium爬取淘宝商品信息

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

利用Selenium爬取淘宝商品信息

selenium＋pyquery爬取淘宝商品信息

爬取淘宝商品信息selenium+pyquery+mongodb

慕课中爬取淘宝商品信息

比价网站的基础-爬取淘宝的商品信息

多进程爬取淘宝商品信息

requests和re库爬取淘宝商品信息

selenium和pyquery爬取淘宝美食商品信息

<day003>登录+爬取淘宝商品信息

使用正则库爬取淘宝商品信息

selenium登录爬取淘宝商品信息

淘宝商品信息爬取（已登录）

使用python利器selenium工具模拟浏览器运行并爬取淘宝商品信息

python selenium实现下拉爬取淘宝商品信息

利用Python爬取淘宝商品信息并进行数据可视化

（廿八）Python爬虫：使用Selenium爬取淘宝商品信息

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)