爬取迷你mp4各个电影信息 - 代码天地

爬取迷你mp4各个电影信息

其他 2018-08-16 22:20:56 阅读次数: 0

网站：www.minimp4.com

# coding=utf-8
import requests
from lxml import etree
class Minimpe_moves(object):

    def Getmovies(self,page):
        url = 'http://www.minimp4.com/movie/?page={}'.format(page)
        html = requests.get(url)
        htmml = etree.HTML(html.text)#解析网页
        href = htmml.xpath('//div[@class="meta"]/h1/a/@href')

        for url_moves in href:
            html1 = requests.get(url_moves)
            htmml1 = etree.HTML(html1.text)
            movie_name = htmml1.xpath('//div[@class="movie-meta"]/h1/text()')#提取电影名字
            #movie_actor =htmml1.xpath('//div[@class="movie-meta"]/p[@id="casts"]/a/text()')#爬取主演名字

            print (movie_name)
            Minimpe_moves.saveMovies(movie_name)
#语法糖　装饰器　静态方法
    @staticmethod
    def saveMovies(data):
        with open('movies.txt','a',encoding = 'utf-8') as f:
            f.write(data[0]+'\n')




#内置属性，别的文件引入这个文件时，无法执行下面代码
if __name__ == "__main__":
    minimp4 = Minimpe_moves ()

    for n in range(11):#爬取1到10页
        minimp4.Getmovies(n)

上图是各个电影主演，基本上每部电影的各个信息都能爬取下来，只需修改对应的xpath即可．

猜你喜欢

转载自blog.csdn.net/wzyaiwl/article/details/81517681

爬取迷你mp4各个电影信息

【转】Python爬取AES加密的m3u8视频流的小电影并转换成mp4

Python爬取AES加密的m3u8视频流的小电影并转换成mp4

爬取豆瓣电影信息

Python爬取电影信息

ffmpeg写mp4信息

简单！直接！粗暴！分三步！批量爬取学习强国页面下的学习视频（.mp4结尾）

到豆瓣爬取电影信息

scrapy爬取豆瓣电影信息

python爬虫，爬取豆瓣电影信息

python爬取猫眼电影信息

Python爬虫：爬取网站电影信息

简单爬虫爬取豆瓣电影信息

python爬虫爬取豆瓣电影信息

爬取豆瓣网电影的数据信息

爬虫爬取豆瓣高分电影信息

python爬虫实现爬取电影信息

怎么爬取豆瓣电影信息

ffmpeg拉取rtsp写入MP4

爬虫实践--豆瓣电影当前上映电影信息爬取

Pytho爬虫-4567电影网电影信息爬取

手把手教你爬取优酷电影信息-2

python采用requests+bs4爬取豆瓣top250电影信息

如何爬取猫眼全部信息（电影信息、演员信息）

mp4 文件

fragment mp4

tomcat mp4

mp4 format

MP4解析

flv to mp4

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)