爬取酷狗酷狗飙升榜，爬虫案例 - 代码天地

爬取酷狗酷狗飙升榜，爬虫案例

编程语言 2018-10-22 01:33:24 阅读次数: 0

版权声明：如有侵权,请联系作者删除该文件! https://blog.csdn.net/Programmer_huangtao/article/details/83181023

#---------------------

import requests
from fake_useragent import UserAgent
from bs4 import BeautifulSoup
import time
#导入相应的库文件
headers ={
    'User-Agent': UserAgent().chrome
}
#加入请求头

def get_info(url):
    # 定义获取信息的函数

    wb_data = requests.get(url,headers=headers)
    soup = BeautifulSoup(wb_data.text,'lxml')
    ranks = soup.select('span.pc_temp_num')
    titles = soup.select('div.pc_temp_songlist.pc_rank_songlist_short > ul > li > a')
    times = soup.select('span.pc_temp_tips_r > span')

    for rank,title,time in zip(ranks,titles,times):
        data = {
            'rank': rank.get_text().strip(),
            'singer': title.get_text().split('-')[0],
            'song': title.get_text().split('-')[-1],
            'time': time.get_text().strip()
            # 通过split获取歌手和歌曲信息
        }
        print(data)
        #获取爬虫信息并按字典格式打印


if __name__=='__main__':
    # 程序主入口
    urls = ['http://www.kugou.com/yy/rank/home/{}-6666.html'.format(str(i))
    for i in range(1,6)]
        #手动查询网页只到5页，所以循环5次
    for url in urls:
        #循环获得新的url
       get_info(url)
       # 循环调用get_info函数
time.sleep(2)
#睡眠1秒,防止被封

（1 ）

导入程序需要的库，

请求库用于请求| |网页

杂志电子| |网页数据。

BeautifulSoup 用于解析网

页数据。时间库的睡眠（）

方法可以让程序暂停。

（2 ）

通过Chrome 浏览器的开发者工具，复制User-Agent ，用于伪装为浏览器，便于爬虫的稳定性。

（3 ）

定义get_info （）函数，用于获取网页信息并输出信息。

（4 ）

为程序的主入口。

猜你喜欢

转载自blog.csdn.net/Programmer_huangtao/article/details/83181023

爬取酷狗酷狗飙升榜，爬虫案例

爬取酷狗飙升榜

python爬虫爬取酷狗音乐排行榜

Python爬取酷狗飙升榜前十首（100）首，写入CSV文件

爬取酷狗音乐

python爬取酷狗音乐排行榜

爬取酷狗TOP_排行榜

【Python】【爬虫】爬取酷狗音乐网络红歌榜

【爬虫入门5】爬取酷狗TOP500

python爬虫教程：爬取酷狗音乐

多进程爬虫python——实例爬取酷狗歌单

爬虫项目实战十二：爬取酷狗音乐

python爬取酷狗排行音乐

酷狗音乐爬虫

爬取酷狗音乐华语新歌榜前100

python使用beautifulsoup4库爬取酷狗的付费榜

【python】爬取酷狗音乐Top500排行榜【附源码】

[Python爬虫]爬虫实例:爬取酷狗TOP500的数据

Matlab 爬虫 Web Scraping with Matlab 02--爬取酷狗TOP500的数据

爬虫学习之4：BeautifulSoup爬取酷狗Top500歌曲

python爬虫——爬取酷狗音乐top500(BeautifulSoup使用方法)

爬虫程序2-爬取酷狗top500

python网络爬虫-爬取酷狗TOP500的数据源码

Java也能做爬虫了？我爬取并下载了酷狗TOP500的歌曲！

爬虫项目3[爬取酷狗音乐Top500歌名]

关于使用requests爬取酷狗hot500的案例

python使用requests爬取数据（酷狗hot500案例）（讲解细致）

爬取酷狗音乐Top500

Python爬取酷狗TOP100

爬取酷狗榜单中的top500

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)