python爬虫:爬取慕课网视频 - 代码天地

python爬虫:爬取慕课网视频

其他 2018-10-23 11:27:24 阅读次数: 0

前段时间安装了一个慕课网app,发现不用注册就可以在线看其中的视频,就有了想爬取其中的视频，用来在电脑上学习。
决定花两天时间用学了一段时间的python做一做。

我使用的是pycharm进行开发,使用BeautifulSoup模块解析html,整个代码进行了比较详细的注释。

整个工程结构:

----entity

--------__init__.py

--------fileinfor.py用来描述视频文件信息

----filedeal

--------__init__.py

--------file_downloader.py用于视频文件的下载

----spider 爬虫的核心内容
--------__init__.py

--------html_downloader.py html下载器

--------html_parser.py  html解析器

--------spiderman.py  爬虫核心逻辑

----test test文件夹主要是用来测试一些用例,不参与整个程序运行

----conf.py 一些全局变量

----index.py 程序启动入口

运行环境:
python 2.7.X
需要安装的支持模块:
BeautifulSoup (pip install或者下载源代码包setup.py),下载链接:https://pypi.python.org/pypi/beautifulsoup4/4.3.2

运行:在windows上直接双击start.bat,linux上没试

现在将程序运行起来,双击start.bat:

输入课程号，选择视频品质:

等到显示100%时，会将视频下载到当前目录下

源代码在我的github上:https://github.com/qiyeboy/spider_smooc

欢迎大家指教学习

最近整理出了有关大数据，微服务，分布式，Java，Python，Web前端，产品运营，交互等1.7G的学习资料，有视频教程，源码，课件，软件工具，面试题等等，这里将珍藏多年的资源免费分享给各位小伙伴们。

领取方式：https://blog.csdn.net/qq_42914528/article/details/81777449

欢迎大家关注我的公众号：

里面会分享很多JAVA技术、新知识、新技术、面试宝典等。
有让技术爱好者（程序猿）得到很大提升的文章资料。

还在犹豫什么，赶紧关注一波，微信搜索公众号：程序员的成长之路。或者扫描下方二维码进行关注。

欢迎关注公众号，和我一起成长！

猜你喜欢

转载自blog.csdn.net/qq_42914528/article/details/82260508

python爬虫:爬取慕课网视频

python爬虫爬取校花网视频

慕课网视频

爬虫----爬取校花网视频

python爬虫:爬取慕课网教学视频（福利向）

慕课网视频下载

慕课网视频打包

慕课网python分布式爬虫打造搜索引擎视频中爬取伯乐网文章

Spring 学习--慕课网视频教学

python爬虫入门练习——爬酷6网视频

简单python爬虫案例(爬取慕课网全部实战课程信息)

python爬虫实例练习：爬取慕课网课程名称以及对应的链接

scrapy爬虫-爬取慕课网全部课程

2018年慕课网视频教程（vue、react，docker、python、java、Go语言）

慕课网视频中的代码---3-2 感知机及Python简易实现

python爬虫（爬取视频）

python爬虫爬取视频

IntelliJ IDEA 学习笔记--慕课网视频

django 我的博客（慕课网视频）笔记

消息摘要算法（慕课网视频总结与知识梳理）

仿慕课网视频播放界面协调布局

python爬取慕课网课程信息

Python-爬取校花网视频(单线程和多线程版本)

day01 python从入门到放弃----爬取某H网视频

2018年慕课网视频教程（vue、react，docker、python、spring、Go语言、java、数据库、算法......）

Python爬虫爬取视频的详细介绍

Python爬虫-视频爬取示例

Python爬虫：爬取网站视频

python爬虫实践——爬取“梨视频”

python 爬虫入门--热点视频爬取

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)