python爬取淘宝网页信息 - 代码天地

python爬取淘宝网页信息

其他 2018-07-25 05:10:21 阅读次数: 0

介绍

该博文主要讲解利用python爬取淘宝页面上的商品内容，包括款式和价格~~~

这里写图片描述

这里写图片描述

源代码

需要chorm浏览器，以及对应的chormdriver，这些百度上可以直接搜到，除此之外还需要安装selenium库，pip install ~

from selenium import webdriver
import time

browser = webdriver.Chrome()
browser.set_page_load_timeout(30)
browser.get('http://www.17huo.com/search.html?sq=2&keyword=%E7%BE%8A%E6%AF%9B')
page_info = browser.find_element_by_css_selector('body > div.wrap > div.pagem.product_list_pager > div')
# print(page_info.text)
pages = int((page_info.text.split('，')[0]).split(' ')[1])
for page in range(pages):
    url = 'http://www.17huo.com/?mod=search&sq=2&keyword=%E7%BE%8A%E6%AF%9B&page=' + str(page + 1)
    browser.get(url)
    browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(3)   # 不然会load不完整
    goods = browser.find_element_by_css_selector('body > div.wrap > div:nth-child(2) > div.p_main > ul').find_elements_by_tag_name('li')
    print('%d页有%d件商品' % ((page + 1), len(goods)))
    for good in goods:
        try:
            title = good.find_element_by_css_selector('a:nth-child(1) > p:nth-child(2)').text
            price = good.find_element_by_css_selector('div > a > span').text
            print(title, price)
        except:
            print(good.text)

爬取的结果

这里只是把结果输出，有需要的话可以保存成json文件或者xml文件以便后续处理，在这里不再多说。

这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_29462849/article/details/81169022

python爬取淘宝网页信息

python爬虫爬取淘宝网页

python爬虫爬取淘宝网商品信息

Python，自己修改的爬去淘宝网页的代码解决Python爬虫爬取淘宝商品信息也不报错，也不输出信息

Python网络爬虫之爬取淘宝网页页面 MOOC可以运行的代码

Python爬虫模拟浏览器的headers、cookie，爬取淘宝网商品信息

Python selenium库爬取淘宝网商品信息

python爬虫实战练手——————淘宝网站的爬取

python 爬取淘宝信息

爬虫学习之18：使用selenium和chrome-headerless爬取淘宝网商品信息（异步加载网页）

python爬取网页信息

Python爬取淘宝商品信息

python爬取淘宝商品页面信息

Python基础项目——利用Python爬虫爬取淘宝网某类商品的图片

python爬虫之requests库传递cookies(爬取2019淘宝网商品列表)

Python3爬取淘宝网商品数据

淘宝网页练习

python根据标签爬取网页信息

Python使用BeautifulSoup爬取网页信息

Python动态爬取网页信息

Python爬取淘宝

爬取淘宝python书籍销售情况动态网页

爬取淘宝页面信息

Python爬取淘宝商品信息入库

python学习之爬取淘宝商品信息

python爬虫 — 爬取淘宝商品信息

python：淘宝商品信息定向爬取

python爬取淘宝美食信息,存放到mongodb中

Python爬取淘宝商品价格销量信息

Python爬虫爬取淘宝，京东商品信息

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)