爬虫之selenium爬取京东商品信息 - 代码天地

爬虫之selenium爬取京东商品信息

其他 2019-10-26 17:34:07 阅读次数: 0

import json
import time
from selenium import webdriver

"""
发送请求
    1.1生成driver对象
    2.1窗口最大化
    2.2下拉滚动条（保证每个位置都刷新）
    3.获取所有li标签列表
    遍历li标签列表提取图片的连接以及主播的名字
    保存图片
翻页
"""
driver = webdriver.Chrome()
driver.maximize_window()
time.sleep(1)
# 京东商品页
driver.get('https://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F12669&sort=sort_rank_asc&trans=1&JL=3_%E5%93%81%E7%89%8C_%E9%AD%85%E6%97%8F%EF%BC%88MEIZU%EF%BC%89#J_crumbsBar')
while True:
    time.sleep(1)
    for i in range(16):
        driver.execute_script('window.scrollTo(0,{})'.format(i * 500))
        time.sleep(1)
    lis = driver.find_elements_by_xpath('//ul[@class="gl-warp clearfix"]/li')
    with open('京东.txt', 'w', encoding='utf-8') as f:
        for li in lis:
            # 商品图片、价格、评价人数、商品名
            img_url = li.find_element_by_xpath('./div/div[1]/a/img').get_attribute('src')
            price = li.find_element_by_xpath('.//strong[@class="J_price"]').text
            buyers = li.find_element_by_xpath('./div/div[5]/strong').text
            name = li.find_element_by_xpath('./div/div[4]//em').text

            # 将信息写入文本
            dic = {}
            dic['name'] = name
            dic['price'] = price
            dic['buyers'] = buyers
            json.dump(dic, f, ensure_ascii=False)
            f.write(',\n')
    try:
        next_url = driver.find_element_by_xpath('//a[@class="pn-next"]').click()
    except Exception as e:
        print(e)
        break

time.sleep(1)
driver.close()

猜你喜欢

转载自www.cnblogs.com/zry-yt/p/11743853.html

爬虫之selenium爬取京东商品信息

python爬虫—selenium爬取京东商品信息

java爬虫，爬取京东商品信息，基于selenium

python爬虫——selenium爬取京东商品信息

python爬虫入门之 selenium 爬取京东的所有商品信息

【爬虫】Scrapy配合Selenium爬取京东动态加载的商品信息

selenium+lxml爬取京东商品信息

Selenium 爬取京东商品信息并分页保存

Selenium介绍--实例爬取京东商品信息与图片

Java爬虫爬取京东商品信息

Python爬虫-爬取京东商品信息

Python爬虫爬取淘宝，京东商品信息

java京东商品信息爬取

爬取京东商品信息

爬取京东商城商品信息

爬虫3 css选择器和xpath选择器, selenium的使用, 爬取京东商品信息

爬虫爬取淘宝商品信息

利用selenium爬取京东商品信息存放到mongodb

04Selenium剩余部分及练习：爬取京东商品信息

selenium自动化爬取京东电脑商品信息用于数据分析

selenium+sqlalchemy 爬取京东商品信息并存入MySQL

selenium+sqlalchemy 爬取京东商品信息并存入MySQL

selenium爬取300条京东懒加载的商品信息

我要爬爬虫(11)-用selenium爬取淘宝商品信息

python 爬虫实战项目--爬取京东商品信息（价格、优惠、排名、好评率等）

Scrapy框架基于crawl爬取京东商品信息爬虫

Python爬虫-爬取京东商品信息-按给定关键词

Python爬虫，根据搜索关键字爬取京东商品信息

爬取京东手机商品信息

day03爬取京东商品信息

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)