python爬虫：爬取豌豆荚APP第一页数据信息（selenium） - 代码天地

python爬虫：爬取豌豆荚APP第一页数据信息（selenium）

其他 2019-07-03 20:41:32 阅读次数: 0

from selenium import webdriver
import time

driver = webdriver.Chrome(r'C:\Users\Auraro\Desktop/chromedriver.exe')

try:
    driver.implicitly_wait(20)
    driver.get('https://www.wandoujia.com/category/6001')

    time.sleep(5)
    js_code = '''
                   window.scrollTo(0,5000)
                   '''
    driver.execute_script(js_code)

    time.sleep(5) # 商品信息加载，等待5s
    app_list = driver.find_elements_by_class_name('card')
    for app in app_list:
        # app名称
        app_name = app.find_element_by_css_selector('.app-title-h2 a').text

        # 详情页url
        detail_url = app.find_element_by_css_selector('.app-title-h2 a').get_attribute('href')

        # 下载人数
        # app大小
        download_num_size= app.find_element_by_class_name('meta').text

        app_content = """
            app名字：{}
            详情页url：{}
            下载人数：{}
            app大小：{}
            \n
        """.format(app_name,detail_url,download_num_size[:8],download_num_size[11:])
        print(app_content)
        with open('豌豆荚app.txt','a',encoding='utf-8') as f:
            f.write(app_content)
    time.sleep(3)


finally:
    driver.close()

　　

猜你喜欢

转载自www.cnblogs.com/Auraro997/p/11128757.html

python爬虫：爬取豌豆荚APP第一页数据信息（selenium）

python爬虫：爬取豌豆荚APP第一页数据信息（requests）

python爬虫：爬取豌豆荚APP第一页数据信息（爬虫三部曲）

Python爬虫爬取豌豆荚休闲小游戏

Day04-爬取豌豆荚app数据

爬取豌豆荚

Day 03(爬取豌豆荚app内容)

python学习之爬取豌豆荚

day04 爬取豌豆荚app数据的两种方法

Day---03 例子：爬取豌豆荚游戏页面信息

requests + bs4 爬取豌豆荚所有应用的信息

day03 爬取豌豆荚

Day04 爬取豌豆荚

day04爬取豌豆荚

php分页数据最后一页继续追加第一页数据

无字天书之Python爬虫第一页

day03——抓取豌豆荚app数据

golang多任务爬虫：爬取爆照吧每个帖子第一页所有的照片

day03 爬豌豆荚

豆瓣读书排名—简单爬取第一页

爬取---Books to Scrape（第一页所有书名和价格）

python爬虫第四天(爬取贴吧第一页，标题，作者，时间，链接，一楼内容只含文本信息)第一版(不用函数，不用类)，只能爬取指定网页

豌豆荚

element-ui el-table，查询数据后默认返回第一页数据

开篇第一页

第一页数组学习

LeetCode 第一页题目

豌豆荚下载|豌豆荚电脑版下载

Python 爬虫爬取多页数据

antd rowSelection 第二页多选的时候选择的是第一页的数据

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)