maoyan.py - 代码天地

maoyan.py

其他 2019-08-22 02:31:25 阅读次数: 0

maoyan

import requests
import json
from lxml import etree

def getOnePage(n):
    url=f'https://maoyan.com/board/4?offset={(n-1)*10}'
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}
    r=requests.get(url,headers=headers)  
    #print(r)
    #返回文本
    return r.text

def parse(text):
    '''解析数据'''
    html=etree.HTML(text)
    names=html.xpath('//div[@class="movie-item-info"]/p[@class="name"]/a/@title')
    releasetimes=html.xpath('//div[@class="movie-item-info"]/p[@class="releasetime"]/text()')
    #print(names)
    #print(releasetimes)
    item={}
    for name,releasetime in zip(names,releasetimes):
        item['name']=name
        item['releasetime']=releasetime
        yield item

def save2file(data):
    '''保存数据'''
    with open('movie.json','a',encoding='utf-8') as f:
        #将字典等python类型对象转换成字符串  \n 换行
        data=json.dumps(data,ensure_ascii=False)+'\n'
        f.write(data)
        

def run():
    for i in range(1,11):
        text=getOnePage(i)
        items=parse(text)
        for item in items:
            save2file(item)

if __name__=='__main__':
    run()

猜你喜欢

转载自www.cnblogs.com/pengyy/p/11392080.html

maoyan.py

Python实现maoyan票房数据并写入MySQL

py

[Py] Py 环境

py 5.9

[py]编码

py 函数

thrift py

py 5.11

py安装

py 5.17

py 5.18

py 5.22

异常.py

py list

a.py

py 5.28

py 5.31

py 6.13

py 6.4

py QScrollArea

线程.py

py编码

py函数

Py逆向

py递归

py进程

py redis

py: join

py: eval

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)