Glidedsky爬虫练习网站第二关详解 - 代码天地

Glidedsky爬虫练习网站第二关详解

其他 2021-03-23 19:01:14 阅读次数: 0

文章目录

25个爬虫项目宝藏教程，你值得拥有！

1、第二关网页查看

在这里插入图片描述

在这里插入图片描述
多页爬取

2、第二关答案

import requests
from bs4 import BeautifulSoup


headers = {
    
    
    "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36",
    #参考图1，自己填
    "Cookie": ""
}
#最后的总数
sum = 0


def getSum(response):
	#引入全局变量sum
    global sum
	#解析
    data = BeautifulSoup(response.text, "lxml")
    
    #参考图2
    #获取全部class值为col-md-1的div标签，然后遍历
    div_list = data.find_all(class_="col-md-1")
    for div in div_list:
        d = BeautifulSoup(str(div), "lxml")
        #取得文本值，并去掉前后空格
        num = d.text.strip()
        sum += int(num)


#开始
if __name__ == '__main__':
	#采用for循环，爬取1000数据
	#这个方法有点慢，如果有会多线程爬虫的小伙伴可以使用多线程爬取
    for i in range(1000):
        print("第"+str(i+1)+"页")
        url = "http://glidedsky.com/level/web/crawler-basic-2?page=" + str(i+1)
        response = requests.get(url=url, headers=headers)
        getSum(response)
    print(sum)

在这里插入图片描述
闯关成功！！！

3、图片辅助分析

图1
在这里插入图片描述
图2

博主会持续更新，有兴趣的小伙伴可以点赞、关注和收藏下哦，你们的支持就是我创作最大的动力！

Java学习从入门到大神学习目录索引

博主开源Python爬虫教程目录索引（宝藏教程，你值得拥有！）

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/llllllkkkkkooooo/article/details/108563913

Glidedsky爬虫练习网站第二关详解

GlidedSky爬虫闯关第二关

第二关练习讲解（下部）

第二关练习讲解

Python：黑板课爬虫闯关第二关

python 黑板课爬虫闯关-第二关

day 11 第二关练习题

day11 第二关练习题

linux第二关练习题

自学linux第二关练习题

第二关：爬虫HTML网页基础 - 0入门到进阶（附练习题） | Python爬虫

GlidedSky爬虫网站练习基础1

黑板客爬虫闯关第一关、第二关

XSS闯关之第二关

掌控安全第二关记录

【linux题目】第二关

sqlzoo第二关select world

第二关：构造方法

Python3 黑板客爬虫闯关第二关

爬虫游戏第二关：第一次破解密码

Day 12 第二关练习题下部

day12 第二关练习题（下部）

sqli-labs练习（第二关）——数字型

csapp实验二 ---bomb(第二关)

webbug3.0靶场第二关

我的机器学习之路第二关

C文件编程分析第二关

第二关——2007NOIP提高组

第二关：核心概念与安装配置

第二关：明确和理解问题

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)