使用selenium实现站长素材图片采集 - 代码天地

使用selenium实现站长素材图片采集

其他 2019-05-06 18:18:02 阅读次数: 0

from selenium import webdriver
import requests,os
from lxml import etree
from selenium.webdriver.chrome.options import Options
from urllib import request

chrome_options = Options()
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')

pro = webdriver.Chrome(executable_path='./chromedriver.exe',options=chrome_options)

url = "http://sc.chinaz.com/tupian/haiyangshengwutupian.html"
pro.get(url)
js = 'window.scrollTo(0,document.body.scrollHeight)'
pro.execute_script(js)
page_text = pro.page_source

tree = etree.HTML(page_text)
url_img = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/img/@src')  #获取图片url列表
names = tree.xpath('//div[@id="container"]/div[@class="box picblock col3 masonry-brick"]/div/a/@alt')   #图片名称列表

if not os.path.exists('./img'):  #生成文件夹
    os.mkdir('./img')    
for index,url in enumerate(url_img):
    img_path = './img/' + names[index]+'.jpg'  #提取图片名称
    request.urlretrieve(url,img_path)

　　

猜你喜欢

转载自www.cnblogs.com/wangtaobiu/p/10821077.html

使用selenium实现站长素材图片采集

基于 selenium 实现网站图片采集

小项目爬虫爬取图片 --站长素材网

使用xpath解析站长素材_免费简历模板

scrapy爬取站长素材

使用 Python + Selenium 批量下载素材

使用 Python + Selenium 批量下载素材

素材图片

WebUploader实现采集图片的功能

基于Selenium实现信息采集功能

【Java】基于Selenium实现信息采集功能

基于SSM框架的图片素材管理系统的设计与实现

实现网站长截图

php使用curl新增微信临时素材(上传图片)

使用Basler相机SDK采集的显示图片

gin框架运行站长素材引用静态文件小例子

xpath爬取站长素材中的免费简历

python3爬取站长素材简历模板详解

图片素材

高楼素材高清图片

常用图片素材

图片素材整合

PPT图片素材

PHP素材图片拆分

SCRAPY+SELENIUM 强势登录17素材网，实现自动签到功能

scratch实现无限地图/svg格式图片的优势/自制素材/少儿编程scratch教研教案课件课程素材脚本

python selenium实现文件、图片上传

在Selenium 利用AutoIt实现图片文件上传

python +selenium 实现图片对比功能

使用swing实现飞行射击游戏（带素材链接）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)