爬虫问题记录1 - 代码天地

爬虫问题记录1

其他 2018-08-11 11:06:12 阅读次数: 0

今天在复习爬虫知识的时候，爬取一个静态网站的站点，爬取下来的字符内容无论如何也不是在网页的开发者工具中看到的。先把问题记录于下！

吸取教训：不要再非重点问题上耗费太多时间，遇到一筹莫展的情况很正常，如果毫无头绪，不如先放到一边，不过记得要把问题记录下来。

我想要爬取句子迷中关键字为”拿破仑“的语录。


header = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.344'
              '0.84 Safari/537.36'}
url = 'https://m.juzimi.com/search/node/%E6%8B%BF%E7%A0%B4%E4%BB%91%20type:sentence'
html = requests.get(url, headers=header)
'拿破仑' in html.text

Out[2]: False

结果显示：False

但网页中的响应栏明明不是这样的，搞不懂了！！

猜你喜欢

转载自blog.csdn.net/zs15321583801/article/details/81564778

爬虫问题记录1

hadoop问题记录1

问题记录—1（递归函数转换）

hadoop日常问题记录（1）

JS小问题记录1

问题记录1：clip-path

gulp入门学习问题记录1

开发琐碎问题记录(1)

Excel 问题记录 1-10

【问题记录】问题记录专用

Android问题记录1：悬浮窗问题

Android问题记录1：悬浮窗问题

Android问题记录1：悬浮窗问题

Hbuilder问题记录

问题记录

Jira 问题记录

Java问题记录

Jenkins问题记录

eclipse问题记录

ios问题记录

弱智问题记录

Storm 问题记录

scrum问题记录

spark问题记录

repo问题记录

Tomcat 问题记录

maven问题记录

Spring问题记录

日常问题记录

Ocaml问题记录

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)