爬取第二弹

http://music.taihe.com/top/dayhot/

要求爬取歌名排行榜

import re
from bs4 import BeautifulSoup
import requests

headers = {
    'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'
}
url="http://music.taihe.com/top/dayhot/"
r=requests.get(url,timeout=30,headers=headers)
r.raise_for_status()
r.encoding=r.apparent_encoding
html=r.text

soup=BeautifulSoup(html,"html.parser")
#print(soup.prettify())

s=soup.find_all("a",target="_blank",href=re.compile('/song/'))   
#find_all后面的这些是观察和测试发现的


for i in range(50): print(s[i].string)

#type(s)发现是

type(s)
Out[150]: bs4.element.ResultSet

然后测试s[1]发现和列表有点像,于是就差不多了,,,

输出如下

沙漠骆驼
卡路里(电影《西虹市首富》插..
往后余生
只要平凡
无问西东
我的爱(慕思《觉/醒》视频主题曲)
至少还有你爱我
半壶纱
寂寞的人伤心的歌
演员
你不来我不老 (对唱版)
红颜旧
一起红火火
独孤天下
都说
明智之举
大鱼
《绝代风华》(天下3十周年主题曲)
东西
你是我今生的依靠
后来
沙漠骆驼
逆流成河
唱一首情歌
一百万个可能
Don't Touch
如约而至
风雨无阻
最美的期待
小苹果(新年Remix版)
过
只羡鸳鸯不羡仙(电影同名主题曲)
38度6(DJ版)
武夷来思
暧昧
不再错过你(电影《进击的男孩》..
瓜很甜
沐春风
想你啦
后来的我们(电影《后来的我们》..
你还要我怎样
大王叫我来巡山
风筝误
我的心里只有你没有他(电影《进..
月弯弯
亲爱的 你在哪里
灵魂走在大街上
当爱已成往事
怒放
暖山

由于现在的知识,所以只能爬取一页,慢慢再更,改进他

猜你喜欢

转载自www.cnblogs.com/xinqidian/p/10224283.html