Python爬取煎蛋网的妹子图，并保存到数据库 - 代码天地

Python爬取煎蛋网的妹子图，并保存到数据库

其他 2018-06-13 05:17:27 阅读次数: 0

因为煎蛋网的图片地址做了处理，我们不能直接获取图片路径

import pymysql
from bs4 import BeautifulSoup
from selenium import webdriver

# 这是防止频繁请求网页而被断开连接
driver = webdriver.PhantomJS()

# 这是煎蛋网的网址，那个page煎蛋网上是不固定的，所以，随便取就好了
BaseUrl = ["http://jandan.net/ooxx/page-{}#comments".format(str(i)) for i in range(50689300, 50689350)]

# 打开数据库连接
db = pymysql.connect('localhost', 'root', 'new password', 'beautiful_girl')

# 创建一个游标对象
cursor = db.cursor()

# 创建SQL语句
sql = '''INSERT INTO PICTURE(ID, IMGURL)VALUES(%s, '%s')'''

# 创建一个保存数据的列表
img = []


def catch():
    # 创建ID值
    Id = 1
    # 循环地址，抓取不止一个网页的数据
    for url in BaseUrl:
        # 抓取第一步
        driver.get(url)
        data = driver.page_source
        # 用来解析网页源码
        soup = BeautifulSoup(data, "html.parser")
        # 将所有div标签 class属性为row的所有标签
        all_data = soup.find_all("div", attrs={'class': 'row'})
        # 循环将这些标签取出来
        for j in all_data:
            # 将里面所有a标签 class属性为view_img_link的所有标签取出来
            img_url = j.find('a', attrs={'class': 'view_img_link'})
            # 去处a标签中的所有图片路径
            link = img_url.get('href')
            if link is None:
                return
            # 将图片路径保存到列表中
            img.append(link)
            print(link)

    # 循环将图片取出来
    for i in img:
        try:
            # 保存到数据库
            cursor.execute(sql % (Id, i))
            db.commit()
        except:
            db.rollback()
        Id += 1
    db.close()


catch()

猜你喜欢

转载自blog.csdn.net/dealpoor/article/details/80667869

Python爬取煎蛋网的妹子图，并保存到数据库

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

python爬取网贷之家平台数据保存到mysql数据库

python 爬虫爬取煎蛋网妹子图

python爬取煎蛋网妹子图，已解密图片~~~~~

爬取煎蛋网妹子图

煎蛋网妹子图爬取

Scrapy爬取妹子图保存到不同目录下

scrapy爬取数据保存到mysql数据库

#python学习笔记#使用python爬取网站数据并保存到数据库

Python3 Scrapy框架学习三：爬取煎蛋网加密妹子图片(全爬)

python之scrapy爬取数据保存到mysql数据库

将python中爬取的数据保存到数据库中

python学习之爬取煎蛋网美女图

python3通过selenium对煎蛋网妹子图的简单爬取

Python爬虫之selenium爬取英雄联盟官网英雄全皮肤图片下载到本地和保存到MongoDB数据库

Python爬虫入门教程，突破煎蛋网反爬措施，妹子图批量抓取！

将scrapy爬取数据保存到mysql数据库和mongodb数据库

Python 爬虫爬取煎蛋网图片

Python爬取煎蛋网图片

python3 爬煎蛋ooxx妹子图

python爬取妹子图

Python爬虫(6):煎蛋网全站妹子图爬虫

Python爬虫煎蛋网全站妹子图爬虫

python-scapy爬取mooc网保存在数据库中并下载图片

Python爬取去哪儿网旅游景点信息并入库保存到MongoDB数据库操作

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

webmagic 实现爬取数据以 JSON 格式保存到数据库

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)