（2）python+selenium第二个自动化脚本：获取猫眼电影排名前100 - 代码天地

（2）python+selenium第二个自动化脚本：获取猫眼电影排名前100

其他 2018-08-11 18:13:41 阅读次数: 0

从猫眼电影的排行中，选出排名在前十页的电影信息，包括：
排名：1
URL：//ms0.meituan.net/mywww/image/loading_2.e3d934bf.png
片名：霸王别姬
主演：张国荣,张丰毅,巩俐
上映时间：1993-01-01(中国香港)
得分：9.6

'''

主要用到request库（自己在cmd下进入python的pip目录，用pip install request命令安装），还有正则表达式的使用，最后把信息写入文件

from selenium import webdriver
import re,requests
#打开浏览器
user_agent='Mozilia(compatible;MSIE5.5;Windows NT)'
headers={'User-Agent':user_agent}
for i in range(10):
      #页数改变
      url='http://maoyan.com/board/4?offset='+str(i*10)
     
#获取网页内容，找出符合正则表达式条件的内容
f=requests.get(url)
      html=f.text
      pic_url=re.findall('<dd>.*?board-index.*?>(.*?)</i>.*?src="(.*?)".*?<p class="name"><a.*?>(.*?)</a>.*?star.*?>(.*?)</p>.*?releasetime.*?>(.*?)</p>.*?integer.*?>(.*?)</i>.*?fraction.*?>(.*?)</i>.*?</dd>',html,re.S)
      #两个正则表达式不用任何符号相连，或者可以认为是.*？来连接。多个字符串输出时是列表的形式item[i]
      #法一输出：列表形式[(.....)]---->print(pic_url)
      #法二输出：输出多个变量值----->item[i],并写入文件保存
      file=open('maoyandy.txt','ab')
      for item in pic_url:
            print("排名：%s\n\tURL：%s\n\t片名：%s%s%s\n\t得分：%s%s\n"%(item[0],item[1],item[2],item[3],item[4],item[5],item[6]))
            for i in range(7):
                  file.write(item[i].encode('utf-8'))
      else:
            print('抓取成功')
            
      '''
      排名：1
	URL：//ms0.meituan.net/mywww/image/loading_2.e3d934bf.png
	片名：霸王别姬
                主演：张国荣,张丰毅,巩俐
        上映时间：1993-01-01(中国香港)
	得分：9.6
      '''

猜你喜欢

转载自blog.csdn.net/qq_34173491/article/details/80765129

（2）python+selenium第二个自动化脚本：获取猫眼电影排名前100

（2-2）python+selenium第二个自动化脚本：用函数实现获取猫眼电影中排名前100的

第二个python&selenium自动化测试实战项目

imageJ marco宏语言，如何自动化地处理第二个的弹窗？

第二个脚本语句

第二个作业（2）

Jenkins简单集成python+selenium自动化脚本。

python爬虫学习之获取猫眼电影排名前10

第二篇——python+selenium自动化测试（环境搭建）

使用Python+selenium实现第一个自动化测试脚本

Python+Selenium学习（四）-第一个自动化脚本

Python+selenium自动化之cookie获取与登录

Python+Selenium自动化测试框架--第一个自动化测试脚本

python+selenium自动化测试框架（2)

第二个

爬取猫眼电影网前100的电影排名

第二个：ssh秘钥分发脚本

Linux运维---第二个shell脚本

python+selenium自动化

python+selenium自动化1

python+selenium自动化测试

BeautifulSoup 获取第二个span标签内容

获取流程第二个节点

Python+Selenium基础篇之3：第一个完整的自动化测试脚本

Python+Selenium基础篇之5-第一个完整的自动化测试脚本

Python+Selenium基础篇之4-第一个完整的自动化测试脚本

基础题库:2 输出第二个整数

2、输出第二个整数

python if 语句写的第二个程序

python for循环从第二个元素开始遍历

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)