python 如何爬取审查元素中Elements里有的元素，而源代码里没有的标签？ - 代码天地

python 如何爬取审查元素中Elements里有的元素，而源代码里没有的标签？

其他 2018-08-17 16:24:05 阅读次数: 0

网址：http://gpj.mofcom.gov.cn/article/ch/201808/20180802773240.shtml

在这里我们可以看到，这个网站的新闻页面的作者，发布时间那一栏的标签在审查元素的Elements里有的元素，而源代码里却没有，如果单纯的使用xpath或者css无法匹配解析出想要的信息。

并且我们可以看到这个元素是使用JavaScript进行渲染的，在源代码中的开头我们可以看到以下这张图片的代码：

解决方案有很多，接下来我们来看看

方法1：正则表达式

在这推荐一个验证正则表达式的网站：http://tool.oschina.net/regex

因此这里举一个例子，解析代码是这样的：

news_author = response.xpath('//script').re('v.{2}\ss.{4}e\s=\s\"[\u4e00-\u9fa5]+\"')[0][13:].replace('"','')

其他方法后续再补充

猜你喜欢

转载自blog.csdn.net/weixin_41931602/article/details/81711190

python 如何爬取审查元素中Elements里有的元素，而源代码里没有的标签？

Python爬虫爬取CSDND首页的所有的文章

Python番外篇：爬取CSDN博文中所有的代码

Python | 用Python爬取LOL所有的英雄信息以及英雄皮肤

【python】Pycharm 说所有的 attribute 都要在 __init__ 里定义?

Python BeautifulSoup 爬取笔趣阁所有的小说

Python爬虫—爬取某网站上面所有的世界港口信息数据

python -又一次爬虫练习（爬取LOL所有的英雄头像）

python爬取华为商城所有的手机参数

python3 得到a.txt中有的而b.txt中没有的汉字

Python练习——找出不是两个数组共有的元素

$("div span")选取里的所有的元素

python爬虫---CrawlSpider实现的全站数据的爬取,分布式,增量式,所有的反爬机制

Python爬codefores所有的题目信息

python特有的元组

所有的Python库

python两个列表元素对比（均含有的元素种类、和的全部元素种类、A包含而B不包含的元素种类）

python对字典里的元素排序

python 字典使用注意：访问dict中没有的对应key的项目

安装anadonda里没有的包

python爬虫——记一次前所未有的经历（爬取魔方格作文）

【python爬虫系列】12.实战一爬取北京地区所有的房租信息

11python xpath 是什么鬼？如下代码中有的对，有的不对

Python 判断数据里有没有 NaN

学好Python薪水有多少|我爬取了所有的Python职位

第4章-29 找出不是两个数组共有的元素 (20分)python

在Elipse中添加Anaconda中既有的python环境

Python与大数据之间有没有关系，图零说有的

python 中利用字典给所有的符号编号

如何使用Selenium Python爬取动态表格中的复杂元素和交互操作

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)