爬虫入门-HTML高级标签学习分享

文章目录

前言

继续之前那篇基础HTML标签的博客,简单分享一下高级标签的学习。

标签简述

这里再列出一些做爬虫时,经常遇到的标签。

div

咱们来看图说话
在这里插入图片描述
我这就用div将页面分成了四块。实际分析页面的时候,div可能是最常见的一个标签,合理分析div有助于帮我们理解网页的整个布局。

点击查看详情

ul

一个ul里可以嵌套多个li,在分析页面的时候,也是很常见的一个标签,具体如下图。
在这里插入图片描述

<ul></ul>
定义和用法

<ul> 标签定义无序列表。
注:常用作导航栏。

点击查看详情

img

先看图,爬取的时候图片有时候也是我们需要爬取的资源,对img标签熟悉一点也是有必要的。
在这里插入图片描述
<img>

定义和用法

img 元素向网页中嵌入一幅图像。 请注意,从技术上讲,<img> 标签并不会在网页中插入图像,而是从网页上链接图像。<img>
标签创建的是被引用图像的占位空间。 <img> 标签有两个必需的属性:src 属性 和 alt 属性。
属性1:src 引用地址:网上的url、本地的路径(相对、绝对)
属性2:alt 图片占位符:加载失败的显示内容
属性3:title 图片提示符

点击查看详情

a

之后爬虫有些页面的跳转可能就是通过点击a标签来实现,所以遇到的也不少。
在这里插入图片描述

定义和用法

<a> 标签定义超链接,用于从一张页面链接到另一张页面。
<a> 元素最重要的属性是 href 属性,它指示链接的目标。
属性1:href
属性2:target

主要功能如下
a.超级链接
b.原始功能回到记录位置 anchor 锚
c.打电话、发邮件
d.协议限定符
点击查看详情

form

这个标签也常用于搜索栏等部分。
在这里插入图片描述
<form></form>

定义和用法

<form> 标签用于为用户输入创建 HTML 表单。 表单能够包含 input 元素,比如文本字段、复选框、单选框、提交按钮等等。
表单还可以包含 menus、textarea、fieldset、legend 和 label 元素。 表单用于向服务器传输数据。

组件1:<input>
特别注意数据名与数据值
点击查看详情

猜你喜欢

转载自blog.csdn.net/weixin_44112790/article/details/86624629