python3 爬虫 - 代码天地

python3 爬虫

其他 2018-05-10 14:56:06 阅读次数: 3

一.html

1.网页由代码构成. 这种代码我们称之为HTML,

2.HTML 是一种浏览器(Chrome, Safari, IE, Firefox等)看得懂的语言, 浏览器能将这种语言转换成我们用肉眼看到的网页

3.除了 HTML, 一同构建多彩/多功能网页的组件还有 CSS 和 JavaScript

4.对于网页，右击鼠标，点击“显示源”（view page source）等差不多意思的选项进入HTML代码

5.在 HTML 中, 基本上所有的实体内容, 都会有个 tag 来框住它. 而这个被 tag 住的内容, 就可以被展示成不同的形式, 或有不同的功能.

6.主体的 tag 分成两部分, header 和 body. 在 header 中, 存放这一些网页的网页的元信息, 比如说 title, 这些信息是不会被显示到你看到的网页中的.

信息大多数时候是给浏览器看, 或者是给搜索引擎的爬虫看.

7.HTML 的第二大块是 body, 这个部分才是你看到的网页信息. 网页中的 heading, 视频, 图片和文字等都存放在这里. 这里的 <h1></h1> tag 就是主标题,

我们看到呈现出来的效果就是大一号的文字. <p></p> 里面的文字就是一个段落. <a></a>里面都是一些链接. 所以很多情况, 东西都是放在这些 tag 中的.

猜你喜欢

转载自www.cnblogs.com/yu-liang/p/9019545.html

python3 爬虫

python3爬虫

python3 爬虫入门

python3爬虫入门

python3 的小爬虫

Python3爬虫应用

Python3 --- 爬虫入门

python3爬虫教程

python3 简单爬虫

python3爬虫之旅

python3爬虫-1

Python3爬虫1

ImageNet爬虫（python3）

Python3爬虫小说

python3爬虫（二）

python3爬虫（一）

python3爬虫（二）

python3 异步爬虫

【Python3爬虫】12306爬虫

【Python3爬虫】拉勾网爬虫

【Python3爬虫】斗鱼弹幕爬虫

【Python3爬虫】最新的12306爬虫

[Python3]Python爬虫实战分享

Python3爬虫（十一）爬虫与反爬虫

Python3爬虫（十六） pyspider框架

Python3爬虫（十五）代理

Python3爬虫视频学习教程

python3 分布式爬虫

python3 爬虫（一）--初识urllib

python3简单爬虫代码

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)