爬取网易云音乐热门歌曲热门评论

python3+selenium+chromedriver,爬取下的的结果中,由于评论中有表情等丢失了部分评论,一个榜单共99首

 

今日子的备忘录.txt:

Cher鉛筆:鉛筆《喜欢的是》2018全国巡演将于10月启程
购票详情请看歌手页艺人信息或登陆秀动app搜索“喜欢的是”
微博 cher鉛筆早晨的三明治:鉛筆就是鉛筆
她是一个独立的个体
是世间独一无二的
陈琦贞也是
所以并没有“谁像谁”这一说
而且歌声听起来都是那么舒服放松,美妙动听,能给人带来一种莫名的好心情。可谓是甚得我的喜爱不封岡:有看过《别相信任何人》的吗,女主每个早晨醒来都会什么都不记得,她每天都会写日记,每一天都要再看一遍之前的日记,最后她通过种种线索,发现了和她住在一起的老公却是用暴力使她得了失忆症的犯罪者,而且她和她老公早已离婚,这个和她住在一起的男人并不是她老公。只有一天记忆有时候并没有那么唯美晋东-:常常把你写写入备忘录斟酌
一支烟后又忘记对你的执着却浮生:自己的备忘录,记的都是关于你的事neutral_安:她说 阳光正好 微风不燥
穿过千千万万的车流奔向你
历尽孤独恐惧
最后是你就好长泽雅美太爱我了怎么办:“活在这世上是一件羞耻的事,慌慌张张、被弄得团团转,更别说帅气了,非常讨厌这样难堪的自己,每天都是这样,但是我却仍然在这里活着。所以你也是,虽然活着很羞耻,但还是要活着,虽然有很多难堪,很多丢脸的事,但是还是要带着这些想逃离的记忆,活下去。”太阳花已残:干净、舒服、初恋般的感觉凉皮三刀:见树有树影斑驳,见风有夜色微醺,见人有容色几许,见你便只是你,除了多看你一眼,我什么都没想。不讲黄段子的人:人生没有重来,即使对于睡醒就会失去记忆的今日子来说,也是相同的。即使记忆会被重置,但也不代表能够度过多次人生。

import time
from selenium import webdriver

driver = webdriver.Chrome()
driver2 = webdriver.Chrome()

driver.get("https://music.163.com/#/discover/toplist")
time.sleep(2)
ele = driver.find_element_by_class_name("g-iframe")
driver.switch_to.frame(ele)
songs = driver.find_elements_by_xpath("//table[@class='m-table m-table-rank']/tbody/tr/td[2]/div/div/div/span/a")

for song in songs:
    url = song.get_attribute("href")
    driver2.get(url)
    time.sleep(5)
    ele = driver2.find_element_by_class_name("g-iframe")
    driver2.switch_to.frame(ele)
    title = driver2.find_element_by_xpath("//div[@class='tit']/em").text
    with open('D:/文档/学习笔记/爬虫/Python网络数据采集/wyy-song-comment/'+title+'.txt', 'a') as f:
        comments = driver2.find_elements_by_xpath("//div[@class='cnt f-brk']")

        for comment in comments[0:10]:
            try:
                f.write(comment.text)
            except:
                print("comment err")
        try:
            print(title)
        except:
            print("title err")
driver.quit()

  

猜你喜欢

转载自www.cnblogs.com/shamobus/p/9509870.html