爬虫案例_网易云歌单 - 代码天地

爬虫案例_网易云歌单

其他 2019-08-23 17:50:45 阅读次数: 0

技术点:

selenium 爬数据

csv 转换数据格式

网易云没换爬虫策略的话代码应该是可以直接跑的

爬虫底线试了一下还是很简单的上手一天差不多可以直接爬了

案例代码:

from selenium import webdriver
import time
import json
import csv


class WangyiMusicSpider():

    def __init__(self, url):
        self.browser = webdriver.Chrome('chromedriver')
        self.browser.get(url)
        time.sleep(2)

    def json_to_scv(self):
        with open("wangyimisic.json", "r", encoding="utf-8") as r:
            results = json.load(r)
        f = open('wangyimusic.csv', 'w', encoding='utf-8')
        csv_writer = csv.writer(f)
        csv_writer.writerow(results[0].keys())
        for result in results:
            csv_writer.writerow(result.values())
        f.close()


    def main(self):
    
     
        iframe_element = self.browser.find_element_by_id('g_iframe')
        # 2> 切换 iframe
        self.browser.switch_to.frame(iframe_element)
   
        data_list = self.browser.find_elements_by_xpath('.//ul[@id="m-pl-container"]/li')

        resuilts = []

        for li in data_list:
            item = {}
           
            item['photo'] = li.find_element_by_xpath('.//img').get_attribute('src')
            item['music_link'] = li.find_element_by_xpath('.//div/a').get_attribute('href')
            item['hot'] = li.find_element_by_xpath('.//span[@class="nb"]').text
            item['title'] = li.find_element_by_xpath('./p/a').text
            item['name'] = li.find_element_by_xpath('.//p[last()]/a').text
            resuilts.append(item)
           

        resuilts_json = json.dumps(resuilts)
        with open('wangyimisic.json', 'w', encoding='utf-8') as a:
            a.write(resuilts_json)

        self.json_to_scv()

    def quit(self):
        self.browser.quit()


if __name__ == '__main__':
    url = 'https://music.163.com/#/discover/playlist'
    obj = WangyiMusicSpider(url)
    obj.main()
    obj.quit()

　　

猜你喜欢

转载自www.cnblogs.com/renoyuan/p/11401602.html

爬虫案例_网易云歌单

爬虫-网易云歌单下载

Python 网络爬虫网易云歌单筛选

爬虫爬取网易云歌单

爬网易云歌单

【Python3爬虫】网易云音乐歌单下载

【爬虫入门】下载网易云歌单中的歌曲到本地

小白学爬虫：网易云音乐歌单（一）

爬虫实战(二) 用Python爬取网易云歌单

网易云音乐歌单

[Python][爬虫02]requests+BeautifulSoup实例:抓取网易云歌单

利用Python爬虫批量下载网易云音乐歌单歌曲

【python爬虫自学笔记】-----爬取网易云歌单中歌曲歌词

手把手教你写网络爬虫（1）：网易云音乐歌单

Python爬虫爬取豆瓣TOP250和网易云歌单

手把手教你写Python网络爬虫：网易云音乐歌单

python 爬虫下载网易歌单歌曲

网易云音乐歌单下载

网易云歌单爬取并保存

Python下载网易云歌单歌曲

用Python挖掘网易云音乐的热门歌单!网易云歌单这样生成的？

爬虫小案例：查询歌手歌单

Python3.7 爬虫（三）使用 Urllib2 与 BeautifulSoup4 爬取网易云音乐歌单

Python爬虫之网易云歌单音频爬取（解决urlretrieve爬取文件不能播放问题）

Python爬虫实战，matplotlib模块，Python实现网易云音乐歌单数据可视化

java实现爬虫，爬取网易歌单信息

python3 下载网易云音乐歌单

爬取网易云音乐所有歌单信息

网易云QQ音乐歌单批量下载

Python数据可视化：网易云音乐歌单

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)