2018-12-06-花了3天下班时间写了个爬虫

个人博客地址——https://www.dogebug.cn/
GitHub地址——https://github.com/yanshigou/


title: “花了3天的下班时间写了个爬虫”
date: 2018-12-06 15:52
author: dzt
subtitle: 爬取喜马拉雅的音频信息
tags:

  • python
  • 爬虫

爬取喜马拉雅网站上所有音频专辑的基本信息

简单分析了网页源码之后 就开始下手去做了

还是遇到不少难题,还好有很多人都做过类似爬虫,查阅相关资料,最终如愿完成

源码在我的github上 —> https://github.com/yanshigou/ximalaya

基本信息

  • 音频名字
  • 专辑名字
  • 图片地址
  • mp3地址
  • m4a地址
  • aac地址

爬取到信息后写入txt文件中和excel文件中

猜你喜欢

转载自blog.csdn.net/dogebug/article/details/86288427
今日推荐